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Python 2 教程 


Python 是 一 门 简单 易学 ， 功 能 强大 的 编程 语言 。 它 具有 高 效 的 高 级 数据 结构 和 简单 而 有 效 的 
面向 对 象 编程 方法 。 Python 优雅 的 语法 和 动态 类 型 以 及 其 解释 性 的 性 质 ， 使 它 在 许多 领域 和 
大 多 数 平台 成 为 编写 脚本 和 快速 应 用 程序 开发 的 理想 语言 。 


从 Python 网 站 http://www.python.org/ 可 以 免费 获得 所 有 主要 平台 的 源 代码 或 二 进 制 形式 的 
Python 解释 器 和 广泛 的 标准 库 ， 并 且 可 以 自由 地 分 发 。 该 网 站 还 包含 许多 免费 的 第 三 方 
Python 模块 、 程 序 、 工 具 以 及 附加 文档 的 发 布 包 和 链接 。 


Python 解释 器 可 以 用 C 或 C++ (或 可 从 C 中 调用 的 其 他 语言 ) 中 实现 的 新 的 函数 和 数据 类 型 轻 
松 扩展 。Python 也 适合 作为 可 定制 应 用 程序 的 一 种 扩展 语言 。 


本 教程 非 正 式 向 读者 介绍 Python 语言 及 其 体系 的 基本 概念 和 功能 。 手 边 有 个 Python 解释 器 来 
随手 实验 很 有 帮助 ， 但 所 有 示例 都 相对 独立 ， 所 以 本 教程 也 可 以 离线 阅读 。 


对 于 标准 对 象 和 模块 的 说 明 ， 请 参阅 Python 标准 库 。Python 语 言 参考 给 出 了 Python 语言 更 正 
式 的 定义 。 要 编写 C 或 C++ 的 扩展 ， 请 阅读 扩展 和 骨 入 Python 解释 器 与 PythomC AP/ 参 考 手 
册 。 也 有 几 本 书 深度 地 介绍 了 Python 。 

本 教程 不 会 尝试 全 面 并 涵盖 每 一 个 单独 特性 ， 甚 至 每 一 个 常用 的 特性 。 相 反 ， 它 介绍 了 许多 
Python 最 值得 注意 的 特点 ， 并 会 给 你 一 个 很 好 的 语言 的 口味 和 风格 。 读 完 它 之 后 ， 你 将 能 够 
阅读 和 编写 Python 的 模块 和 程序 ， 并 可 以 准备 好 更 多 地 了 解 Pythomn 标 准 库 中 描述 的 各 种 
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词汇 表 也 值得 浏览 一 下 。 


1. 吊 吊 你 的 骨 口 


如 果 你 要 用 计算 机 做 很 多 工作 ， 最 终 你 发 现 是 有 一 些 您 希望 自动 执行 的 任务 。 例 如 ， 你 可 能 
希望 对 大 量 的 文本 的 文件 执行 搜索 和 蔡 换 ， 或 以 复 条 的 方式 重 命名 并 重新 排列 一 堆 照 片 文 
件 。 也 许 你 想 写 一 个 小 的 自 定义 数据 库 ， 或 一 个 专门 的 GUI 应 用 程序 或 一 个 简单 的 游戏 。 


如 果 你 是 一 个 专业 的 软件 开发 人 员 ， 您 可 能 必须 使 用 几 个 C/C++/Java 库 ， 但 发 现 通 常 的 编写 / 
编译 /测试 /重新 编译 周期 太 慢 。 也 许 你 要 写 这 样 的 库 中 的 测试 套件 ， 然 后 发 现 编写 测试 代码 是 
很 乏味 的 工作 。 或 也 许 您 编写 了 一 个 程序 ， 它 可 以 使 用 一 种 扩展 语言 ， 但 你 不 想 为 您 的 应 用 
程序 设计 与 实现 一 个 完整 的 新 语言 。 


Python 正 是 这 样 为 你 准备 的 语言 。 


你 可 以 为 其 中 一 些 任务 写 一 个 Unix shell 脚 本 或 Windows 批 处 理 文件 ， 但 是 shell 脚 本 最 适合 移 
动 文件 和 更 改 文本 数据 ， 不 适合 用 于 GUI 应 用 程序 或 游戏 。 你 可 以 写 一 个 C/C++/Java 程 序 ， 
但 是 甚至 程序 的 第 一 个 初稿 都 可 能 花费 大 量 的 开发 时 间 。Python 更 简单 易 用 ， 可 用 于 
Windows, Mac OS X 和 Unix 操 作 系统 ， 并 将 帮助 您 更 快 地 完成 工作 。 


Python 使 用 很 简单 ， 但 它 是 一 个 真正 的 编程 语言 ， 比 shell 脚 本 或 批 处 理 文 件 对 于 大 型 的 程序 
提供 更 多 的 结构 和 支持 。 另 一 方面 ，Python 还 提供 比 C 更 多 的 错误 检查 ， 并 且 ， 作 为 一 种 高 级 
语言 ， 它 有 内 置 的 高 级 数据 类 型 ， 比 如 灵活 的 数组 和 字典 。 因 为 其 更 加 一 般 的 数据 类 型 ， 
Python 比 Awk 甚 至 Per| 适 用 于 很 多 更 大 的 问题 领域 ， 而 且 在 Python 中 很 多 事情 至 少 和 那些 语言 
一 样 容易 。 


Python 人 允许 您 将 您 的 程序 拆 分 成 可 以 在 其 它 Python 程 序 中 重复 使 用 的 模块 。 它 拥有 大 量 的 标 
准 模 块 ， 你 可 以 将 其 用 作 你 的 程序 的 基础 一 或 者 作为 学 习 Python 编 程 的 示例 。 这 些 模块 提供 
诸如 文件 /O、 系 统 调用 、 套 接 字 和 其 至 用 户 图 形 界 面 接 口 ， 例 如 Tk。 


Python 是 一 门 解 释 性 的 语言 ， 因 为 没有 编译 和 链接 ， 它 可 以 节省 你 程序 开发 过 程 中 的 大 量 时 
间 。Python 解 释 器 可 以 交互 地 使 用 ， 这 使 得 试验 Python 语言 的 特性 、 编 写 用 后 即 扔 的 程序 或 
在 自 底 向 上 的 程序 开发 中 测试 功能 非常 容易 。 它 也 是 一 个 方便 的 桌面 计算 器 。 


Python 使 程序 编写 起 来 能 够 紧凑 和 可 读 。 编 写 的 Python 程序 通常 比 等 价 的 C、C++ 或 Java 程 
序 短 很 多 ， 原 因 有 几 个 : 


e 高 级 数据 类 型 允许 您 在 单个 语句 中 来 表达 复杂 的 操作 ; 
e 语句 分 组 是 通过 缩 进 ， 而 不 是 开始 和 结束 的 括号 ; 
e 任何 变量 或 参数 的 声明 不 是 必要 的 。 


Python 是 可 扩展 的 : 如 果 你 知道 如 何 用 C 编 程 ， 那 么 将 很 容易 添加 一 个 新 的 内 置 画 数 或 模块 到 
解释 器 中 ， 要 么 为 了 以 最 快 的 速度 执行 关键 的 操作 ， 要 么 为 了 将 Python 程序 与 只 有 二 进 制 形 
式 的 库 (如 特定 供应 商 提供 的 图 形 库 ) 链接 起 来 。 一 旦 你 真 的 着 迷 ， 你 可 以 把 Python 解释 器 
链接 到 C 编 写 的 应 用 程序 中 ， 并 把 它 当 作 那 个 程序 的 扩展 或 命令 行 语言 。 


顺便 说 一 句 ，Python 语 言 的 名 字 来 自 于 BBC 的 “Monty Python's Flying Circus" 5 E, Sita 
物 无 关 。 在 文档 中 引用 Monty Python 短 剧 不 仅 可 以 ， 并 且 鼓 励 ! 

既然 现在 你 们 都 为 Python 感到 兴奋 ， 你 们 一 定 会 想 更 加 详细 地 研究 它 。 学 习 一 门 语言 最 好 的 
方法 就 是 使 用 它 ， 本 教程 推荐 你 边 读 边 使 用 Python 解 释 器 练习 。 

在 下 一 章 中 ， 我 们 将 解释 Python 解释 器 的 用 法 。 这 是 很 简单 的 一 件 事情 ， 但 它 有 助 于 试验 后 
面 的 例子 

本 教程 的 其 余部 分 通过 实例 介绍 Python 语言 和 体系 的 各 种 特性 ， 以 简单 的 表达 式 、 语 句 和 数 
据 类 型 开始 ， 然 后 是 函数 和 模块 ， 最 后 讲述 高 级 概念 ， 如 异常 和 用 户 自 定义 的 类 。 


2. Python 解释 器 


2.1 调用 解释 器 


在 可 用 的 机 器 上 ，Python 解 释 器 通常 安装 成 /usr/local/bin/python ; 请 将 /usr/local/bin 放 在 您 的 
Unix shell 搜 索 路 径 ， 以 使 得 可 以 通过 在 shell 中 键入 命 全 


python 


来 启动 它 。 由 于 解释 器 放置 的 目录 是 一 个 安装 选项 ， 其 它 地 方 也 是 可 能 的 ; 请 与 您 本 地 的 
Python 专家 或 系统 管理 员 联 系 。 (例如 ，/usr/local/python 是 另外 一 个 常见 的 位 置 。) 


在 Windows 机 器 上 ，Python 的 安装 通常 放 在 C:\Python27， 当 然 你 可 以 在 运行 安装 程序 时 进行 
更 改 。 你 可 以 在 一 个 DOS 窗 口 的 命令 提示 符 下 键入 以 下 命令 来 把 这 个 目录 添加 到 路 径 中 : 


set path=%path%;C:\python27 


主 提示 符 下 键入 文件 结束 字符 (Unix 上 是 Control-D、Windows 上 是 Control-Z) 会 导致 解释 器 
以 0 退出 状态 退出 。 如 果 无 法 正常 工作 ， 您 可 以 通过 键入 以 下 命令 退出 解释 器 : quit()。 


解释 器 的 行 编辑 功能 通常 不 是 很 复杂 。 在 Unix 上 ， 不 管 是 谁 安装 的 ， 解 释 器 可 能 已 启用 对 
GNU readline 库 的 支持 ， 该 库 添 加 了 更 详细 的 交互 式 编辑 和 历史 记录 功能 。 检 查 是 否 支 持 命 
兮 行 编 辑 的 最 快 的 方式 也 许 是 对 你 的 第 一 个 Python 提示 符 键 和 信 Control-P。 如 果 它 发 出 蜂 鸣 
声 ， 则 有 命 邻 行 编辑 ; 请 参阅 附录 交互 式 输 入 编辑 和 历史 蔡 代 的 有 关 快 捷 键 的 介绍 。 如 果 什 
么 都 没 发 生 ， 或 者 显示 ^P， 则 命令 行 编辑 不 可 用 ; 你 就 只 能 够 使 用 退 格 键 删 除 当前 行 中 的 字 
符 。 


解释 器 有 些 像 Unix shell: 当 调用 时 使 用 连接 到 一 个 tty 设 备 作为 标准 输入 ， 它 交互 地 读 取 并 执 
Tos ; 当 用 文件 名 参数 或 文件 作为 标准 输入 调用 ， 它 将 读 取 并 执行 该 文件 中 的 脚本 。 


第 二 种 启动 解释 器 的 方式 是 python-ccommand[arg]...， 它 会 执行 Command 中 的 语句 ， 类似 于 
shell 的 -c 选 项 。 因 为 Python 语句 经 常 包含 空格 或 其 他 shell 特 殊 字 符 ， 通 常 建议 把 全 部 
commandq 放 在 单 引号 里 。 


有 些 Python 模 块 也 是 可 执行 的 脚本 。 这 些 模 块 可 以 使 用 python-mmodule[arg]... 直 接 调 用 ， 这 
和 在 命 命 行 输入 完整 的 路 径 名 执行 module 的 源 文件 是 一 样 的 。 


有 时 使 用 一 个 脚本 文件 ， 能 够 在 运行 该 脚本 之 后 进入 交互 模式 非常 有 用 。 这 可 以 通过 在 脚本 
前 面 加 上 -/ 选 项 实现 。 


2.1.1. 参数 传递 


调用 解释 器 时 ， 脚 本 名 称 和 其 他 参数 被 转换 成 一 个 字符 串 列 表 并 赋值 给 sys 模 块 中 的 argv 变 
量 。 你 可 以 通过 importsys 访 问 此 列表 。 列 表 的 长 度 是 至 少 是 1 ; 如 果 没 有 给 出 脚本 和 参数 ， 
sys.argv[0] 是 一 个 空 字符 串 。 当 使 用 -ccommand 时 ，sys.argv[0] 被 设置 为 '-c'。 当 使 用 - 
mmodule 时 ，sys.argv[0] 被 设 定 为 指定 模块 的 全 名 。-ccommand 或 -mmodule 后 面 的 选项 不 会 
被 Python 解释 器 的 选项 义理 机 制 解析 ， 而 是 被 保存 在 sys.argv 中 ， 供 命令 或 模块 使 用 。 


2.1.2. 交互 模式 


当 命 令 从 tty 读 取 时 ， 就 说 解释 器 在 交互 模式 下 。 这 种 模式 下 解释 器 以 主 提示 符 提示 下 一 个 命 
今 ， 主 提示 符 通常 为 三 个 大 于 号 (>>>) ; 对 于 续 行 解释 器 以 从 提示 符 提示 ， 默 认为 三 个 点 
(...) 。 在 第 一 个 提示 符 之 前 ， 解 释 器 会 打印 出 一 条 欢迎 信息 声明 它 的 版 本 号 和 授权 公告 : 


python 

Python 2.7 (#1, Feb 28 2010, 00:02:06) 

Type "help", "copyright", "credits" or "license" for more information. 
>>> 


输入 多 行 结构 时 需要 续 行 。 作 为 一 个 例子 ， 看 看 这 个 if 语句 : 


>>> the world is flat = 1 
>>> if the world is flat: 
print "Be careful not to fall off!" 


Be careful not to fall off! 


2.2. 解释 器 及 其 环境 


2.2.1. 错误 义理 


鞋 误 发 生 时 ， 解 释 器 会 打印 错误 信息 和 堆栈 跟踪 信息 。 在 交互 模式 下 ， 它 会 返回 到 主 提示 
符 ; 当 输 入 来 自 一 个 文件 ， 它 会 打印 堆栈 跟踪 信息 ， 然 后 以 非 需 退 出 状态 退出 。 (由 try 语 句 
中 的 except 子 句 处 理 的 异常 不 是 这 方面 的 错误 ) 。 有 些 错误 是 致命 的 并 导致 非 震 状态 退出 ; 
这 通常 由 于 内 部 不 一 致 和 某 些 情 况 下 的 内 存 不 足 导 致 。 所 有 错误 消息 都 号 人 标准 错误 流 ; 执 
行 命 令 的 普通 输出 写 人 标准 输出 。 


在 主 提示 符 或 从 提示 符 后 输入 中 断 符 (通常 为 Control-C 或 DEL) 可 以 取消 输入 ， 并 返回 到 主 提示 
符 。[1] 命 令 执 行 过 程 中 输入 中 断 符 将 引发 Keyboardlnterrupt 异 常 ， 它 可 以 被 try 语 名 截获 。 


2.2.2. 可 执行 的 Python 脚本 


在 类 BSD 的 Unix 系 统 上 ， 可 以 将 Python 脚本 变 成 可 直接 执行 的 ， 就 像 shell 脚 本 一 样 ， 通 过 放 
置 一 行 


#! /usr/bin/env python 


(假定 解释 器 在 用 户 的 PATH 中 ) 在 脚本 的 开始 并 且 给 文件 可 执行 的 模式 。#! 必 须 是 文件 最 开 
始 的 两 个 字符 。 在 一 些 平 台 上 ， 第 一 行 必须 以 一 个 Unix 风 格 的 行 结束 符 (n) 结束 ， 不 能 是 
Windows 的 行 结束 符 (\r\n') 。 注 意 ， 字 符 多 在 Python 中 用 于 起 始 一 个 注释 。 


通过 chmod 命 令 可 以 给 予 脚 本 可 执行 的 模式 或 权限 : 


$ chmod +x myscript.py 


在 Windows 系 统 上 ， 没 有 "可 执行 模式 "的 概念 。Python 安 装 程序 会 自动 将 .py 文件 与 
python.exe 关 联 ， 双 击 Python 文 件 将 以 脚本 的 方式 运行 它 。 扩 展 名 也 可 以 是 .pyw， 在 这 种 情 
况 下 ， 通 常 出 现 的 控制 台 窗 口 不 会 再 显示 了 。 


2.2.3. 源 程 序 的 编码 


在 Python 源 文件 中 可 以 使 用 非 ASCIIl 编 码 。 最 好 的 方法 是 在 执行 的 后 面 再 增加 一 行 特殊 的 注释 
来 定义 源 文件 的 编码 : 


# -*- coding: encoding -*- 


通过 此 声明 ， 源 文件 中 的 所 有 字符 将 被 视 为 由 encoding 编 码 ， 并 且 可 以 直接 写 由 选中 的 编码 
方式 编码 的 Unicode 字 符 串 字面 量 。 在 Python 库 参考 手册 的 codecs 小 节 中 ， 可 以 找到 所 有 可 
能 的 编码 方式 列表 。 


例如 ， 若 要 写 入 包含 欧元 货币 符号 的 Unicode 字面 量 ， 可 以 使 用 ISO-8859-15 编码 ， 其 欧元 
符号 的 值 为 164 。 此 脚本 中 ， 以 ISO-8859-15 编码 ， 保 存 时 将 打印 的 值 8364 (Unicode 代码 
点 相应 的 欧元 符号 ) ， 然 后 退出 : 


# -*- coding: iso-8859-15 -*- 


currency = u"€" 
print ord(currency) 


如 果 你 的 编辑 器 支持 保存 为 带 有 UTF-8 字 节 顺 序 标记 (也 叫做 BOM) 的 UTF-8 格 式 的 文件 ， 你 可 
以 使 用 这 种 功能 而 不 用 编码 声明 。1IDLE 如 果 设 置 了 Options/General/Default Source 
Encoding/UTF-8 也 支持 此 功能 。 注 意 ， 这 种 标记 方法 在 旧 的 Python 版 本 中 (2.2 及 更 早 ) 是 
不 能 识别 的 ， 同 样 也 不 能 被 能 够 处 理 #! (只 在 Unix 系 统 上 使 用 ) 行 的 操作 系统 识别 。 


通过 使 用 UTF-8 编码 〈 无 论 是 BOM 方 式 或 者 是 编码 声明 方式 ) ， 世 界 上 大 多 数 语言 的 字符 可 
以 在 字符 串 字 面 量 和 注释 中 同时 使 用 。 在 标识 符 中 使 用 非 ASCII 字符 是 不 支持 的 。 若 要 正确 
显示 所 有 这 些 字 符 ， 您 的 编辑 器 必须 认识 该 文件 是 UTF-8 编码 ， 并 且 它 必须 使 用 支持 文件 中 
所 有 字符 的 字体 。 


2.2.4. 交互 式 启 动 文件 


当 您 以 交互 方式 使 用 Python 时 ， 让 解释 器 在 每 次 启动 时 执行 一 些 标准 命令 会 变 得 非常 方便 。 
你 可 以 通过 设置 环境 变量 PYTHONSTARTUP 为 包含 你 的 启动 命令 的 文件 的 名 字 。 这 类 似 于 
Unix shell 的 .profile 功 能 。 


这 个 文件 只 会 在 交互 式 会 话 时 读 取 ， 当 Python 从 脚本 中 读 取 命令 时 不 会 读 取 ， 当 /dev/tty 在 
命令 中 明确 指明 时 也 不 会 读 取 (尽管 这 种 方式 很 像 是 交互 方式 ) 。 它 和 交互 式 命 全 在 相同 的 
命名 空间 中 执行 ， 所 以 在 交互 式 会 话 中 ， 由 它 定 义 或 引用 的 一 切 可 以 在 解释 器 中 不 受 限制 地 
使 用 。 您 还 可 以 在 此 文件 中 更 改 sys.ps1 和 sys.ps2 的 提示 符 。 


如 果 您 想 要 从 当前 目录 读 取 额外 的 启动 文件 ， 你 可 以 在 全 局 启动 文件 中 使 用 这 样 的 代码 
ifos.path.isfile('.pythonrc.py'):execfile('.pythonrc.py')。 如 果 你 想 要 在 脚本 中 使 用 启动 文件 ， 必 
须要 在 脚本 中 明确 地 写 出 : 


import os 

filename = os.environ.get('PYTHONSTARTUP') 

if filename and os.path.isfile(filename): 
execfile(filename) 


2.2.5. 目 定义 模块 


Python 提供 了 两 个 钩子 来 定制 化 它 : sitecustomize 和 usercustomize。 要 查看 它 如 何 工作 ， 你 
首先 需要 找到 你 的 用 户 site-packages 目 录 。 启 动 Python 并 运行 下 面 的 代码 : 


>>> import site 
>>> site.getusersitepackages() 
"/home/user/.local/lib/python2.7/site-packages' 


现在 你 可 以 在 此 目录 下 创建 名 为 usercustomize.py 的 文件 ， 并 把 任何 你 想 要 的 东西 放 在 里 面 。 
它 将 影响 每 个 Python 调用 ， 除 非 启 动 时 用 -s 选 项 来 禁用 自动 导入 。 


sitecustomize 的 工作 方式 相同 ， 但 通常 是 由 计算 机 的 管理 员 在 全 局 site-packages 目 录 中 创 
建 ， 并 在 usercustomize 之 前 导入 。 更 多 详细 信息 请 参阅 site 模 块 的 文档 。 


脚注 


| [1] | GNU Readline 库 的 一 个 问题 可 能 导致 它 不 会 发 生 。 | |-----|-----| 


3. Python 简介 


以 下 的 示例 中 ， 输 入 和 输出 通过 是 否 存 在 提示 符 (>>> 和 ...) 来 区 分 : 如 果 要 重复 该 示例 ， 你 
必须 在 提示 符 出 现 后 ， 输 入 提示 符 后 面 的 所 有 内 容 ; 没有 以 提示 符 开头 的 行 是 解释 器 的 输 
出 。 注 意 示例 中 出 现 从 提示 符 意味 着 你 一 定 要 在 最 后 加 上 一 个 空 行 ; 这 用 于 结束 一 个 多 行 命 


A 
To 


本 手册 中 的 很 多 示例 ， 其 至 在 交互 方式 下 输入 的 示例 ， 都 带 有 注释 。Python 中 的 注释 以 哈 希 
字符 # 开 始 ， 直 至 实际 的 行 尾 。 注 释 可 以 从 行 首 开始 ， 也 可 以 跟 在 空白 或 代码 之 后 ， 但 不 能 
含 在 字符 串 字 面 量 中 。 字 符 串 字面 量 中 的 # 字 符 仅 仅 表 示 打 ”因为 注释 只 是 为 了 解释 代码 并 且 
不 会 被 Python 解释 器 解释 ， 所 以 敲 人 示例 的 时 候 可 以 忽略 它们 。 


例如 : 


# this is the first comment 
spam = 1 # and this is the second comment 
# ... and now a third! 
text = "# This is not a comment because it's inside quotes." 


3.1. 用 Python 作为 计算 器 

让 我 们 党 试 一 些 简单 的 Python 命令 。 和 启动 解释 器 然后 等 待 主 提 示 符 >>>。 (应 该 不 需要 很 
久 。) 

3.1.1. 数字 


解释 器 可 作为 一 个 简单 的 计算 器 : 你 可 以 向 它 输入 一 个 表达 式 ， 它 将 返回 其 结果 。 表 达 式 语 
AREA : 运算 符 +、-、* 和 /的 用 法 就 和 其 它 大 部 分 语言 一 样 (例如 Pascal 或 C) ; 括号 (()) 可 
以 用 来 分 组 。 例 如 : 


>>> (50 - 5.0*6) / 4 


>>> 8 / 5.0 


整数 (例如 2,4,20) 的 类 型 是 int， 带 有 小 数 部 分 的 数字 (例如 5.0, 1.6) 的 类 型 是 float。 在 本 教程 的 
后 面 我 们 会 看 到 更 多 关于 数字 类 型 的 内 容 。 


除法 (/) 返 回 的 类 型 取决 于 它 的 操作 数 。 如 果 两 个 操作 数 都 是 int， 将 采用 floor 除 法 (floor 
division) 并 返回 一 个 int。 如 果 两 个 操作 数 中 有 一 个 是 float， 将 采用 传统 的 除法 并 返回 一 

个 float。 还 提供 // 运 算 符 用 于 floor division 而 无 论 操作 数 是 什么 类 型 。 余 数 可 以 用 % 操 作 符 计 
2: 


>>> 17 / 3 # int / int -> int 

5 

>>> 17 / 3.0 # int / float -> float 

5.666666666666667 

>>> 17 // 3.0 # explicit floor division discards the fractional part 
5.0 

>>> 17 % 3 # the % operator returns the remainder of the division 

2 

>>> 5 * 3+ 2 # result * divisor + remainder 

17 


iit Python, ALMA is Bit ARR] : 


>>> 5 ** 2 # 5 squared 

25 

>>> 2 ** 7 #2 to the power of 7 
128 


等 号 (=) 用 于 给 变量 赋值 。 赋 值 之 后 ， 在 下 一 个 提示 符 之 前 不 会 有 任何 结果 显示 : 


>>> width = 20 
>>> height = 5*9 
>>> width * height 
900 





如 果 变 量 没有 “定义 ”( 赋 值 ) ， 使 用 的 时 候 将 会 报错 : 


>>> n # try to access an undefined variable 
Traceback (most recent call last): 

File "«stdin»", line 1, in «module» 
NameError: name 'n' is not defined 


Python 中 完全 支持 浮 点 数 ; 整数 和 浮 点 数 的 混合 计算 中 ， 整 数 会 被 转换 为 浮 点 数 : 


zpRX o a eO 4 abus 
It als) 

>>> 7.0 / 2 

Sn 


在 交互 模式 下 ， 最 近 一 次 表达 式 的 值 被 赋 给 变量 } 
时 候 ， 可 以 方便 的 进行 连续 计算 ， 例 如 : 


>>> tax = 12.5 / 100 
>>> price = 100.50 
>>> price * tax 
12.5625 

>>> price + _ 
113.0625 

>>> round(_, 2) 
113.06 


用 户 应 该 将 这 个 变量 视 为 只 读 的 。 不 要 试图 去 给 
变量 ， 并 且 屏 敬 了 内 置 交 量 的 魔术 效果 。 


除了 int 和 float， 
复数 ， 使 用 后 级 j 或 J 表示 虚数 部 分 〈 例 如 3+5j) 。 


3.1.2. 字符 串 


它 赋 值 一 


Python 还 支持 其 它 数字 类 型 ， 例 如 DecimalandFraction。Python 还 


这 意味 着 把 Python 当做 桌面 计算 器 使 用 的 


你 将 会 创建 出 一 个 独立 的 同名 局 部 


EA StF 


除了 数值 ，Python 还 可 以 操作 字符 串 ， 可 以 用 几 种 方法 来 表示 。 它 们 可 以 用 单 引 号 (…") 或 双 


引号 ("...") 括 起 来 ， 效 果 是 一 样 的 [2]。 


>>> 'spam eggs' # single quotes 
"spam eggs' 
>>> 'doesn\'t' # use \' 
"doesn't" 

>>> "doesn't" # ...or use double quotes instead 
"doesn't" 
"Yes," he said.' 
'"Yes," he said.' 

>>> "\"Yes,\" he said." 
'"Yes," he said.' 
Isn\'t," 


mem te, n" 


Ep iy she said.' 


she said.' 


\ 可 以 用 来 转 义 引号 。 


to escape the single quote... 


在 交互 式 解释 器 中 ， 输 出 的 字符 串 会 用 引号 引起 来 ， 特 殊 字符 会 用 反 斜 杠 转 义 。 虽 然 可 能 和 
输入 看 上 去 不 太一 样 ， 但 是 两 个 字符 串 是 相等 的 。 如 果 字 符 串 中 只 有 单 引 号 而 没有 双 引 号 ， 


就 用 双 引 号 引用 ， 人 否则 用 单 引 号 引用 。 


>>> '"Isn\'t," she said.' 

'""IsnN't," she said.' 

>>> print '"Isn\'t," she said.' 

"Isn't," she said. 

>>> s = 'First line.\nSecond line.' # \n means newline 
>>> s # without print(), \n is included in the output 
"First line.\nSecond line. ' 

>>> print s # with print, \n produces a new line 

First line. 

Second line. 


如 果 你 前 面 带 有 \ 的 字符 被 当 作 特殊 字符 ， 你 可 以 使 用 原始 字符 串 ， 方 法 是 在 第 一 个 引号 前 面 
加 上 一 个 r: 


>>> print 'C:\some\name' # here \n means newline! 
C:Nsome 

ame 

>>> print r'C:NsomeNname' # note the r before the quote 
C: NsomeNname 


字符 串 可 以 跨 多 行 。 一 种 方法 是 使 用 三 引号 : ""…"" 或 者 ".……"。 行 尾 换行 符 会 被 自动 包含 到 字 
符 串 中 ， 但 是 可 以 在 行 尾 加 上 \ 来 避免 这 个 行为 。 下 面 的 示例 : 


print """\ 

Usage: thingy [OPTIONS] 
-h Display this usage message 
-H hostname Hostname to connect to 


将 生成 以 下 输出 (注意 ， 没 有 开始 的 第 一 行 ) 


Usage: thingy [OPTIONS] 
-h Display this usage message 
-H hostname Hostname to connect to 


字符 串 可 以 用 + 操作 符 连 接 ， 也 可 以 用 * 操 作 符 重 复 多 次 : 


>>> # 3 times 'un', followed by 'ium' 
>>> 8 * 'un' + 'ium' 


'unununium' 


相 令 的 两 个 或 多 个 字符 串 字面 量 〈 用 引号 引起 来 的 ) 会 自动 连接 。 


>>> 'Py' 'thon' 
'Python' 


>>> prefix = 'Py' 


>>> prefix 'thon' # can't concatenate a variable and a string literal 


SyntaxError: invalid syntax 


>>> ('un' * 3) 'ium' 


SyntaxError: invalid syntax 


如 果 你 想 连 接 多 个 变量 或 者 连接 一 个 变量 和 一 个 字面 量 ， 使 用 + : 


>>> prefix + 'thon' 
'Python' 


这 个 功能 在 你 想 切 分 很 长 的 字符 串 的 时 候 特别 有 用 : 


>>> text = ('Put several strings within parentheses ' 
"to have them joined together.') 
>>> text 


"Put several strings within parentheses to have them joined together.' 


字符 串 可 以 素 引 ， 第 一 个 字符 的 索引 值 为 0。Python 没 有 单独 的 字符 类 型 ; 一 个 字符 就 是 一 个 
简单 的 长 度 为 1 的 字符 串 。 


>>> word = 'Python' 

>>> word[0] # character in position 0 
'p! 

>>> word[5] # character in position 5 
!n! 


索引 也 可 以 是 负 值 ， 此 时 从 右 侧 开始 计数 : 


>>> word[-1] # last character 

!n' 

>>> word[-2] # second-last character 
‘oO! 

>>> word[-6] 

'p! 


注意 ， 因 为 -0 和 0 是 一 样 的 ， 负 的 索引 从 -1 开始 。 


除了 索引 ， 还 支持 切片 。 索 引用 于 获得 单个 字符 ， 切 片 让 你 获得 一 个 子 字符 串 。 


>>> word[0:2] # characters from position 0 (included) to 2 (excluded) 
"Py! 
>>> word[2:5] # characters from position 2 (included) to 5 (excluded) 
"tho' 


注意 ， 包 含 起 始 的 字符 ， 不 包含 末尾 的 字符 。 这 使 得 s[:i]+s[i:] 永 远 等 于 s : 


>>> word[:2] + word[2:] 
'Python' 
>>> word[:4] + word[4:] 
'Python' 


切片 的 索引 有 非常 有 用 的 默认 值 ; 省 略 的 第 一 个 素 引 默认 为 需 ， 省 略 的 第 二 个 索引 默认 为 切 
片 的 字符 串 的 大 小 。 


>>> word[:2] # character from the beginning to position 2 (excluded) 
'py! 

>>> word[4:] # characters from position 4 (included) to the end 

‘on! 

>>> word[-2:] # characters from the second-last (included) to the end 
"ont 


有 个 方法 可 以 记 住 切片 的 工作 方式 ， 把 索引 当做 字符 之 间 的 点 ， 第 一 个 字符 的 左边 是 0。 含 
有 n 个 字符 的 字符 串 的 最 后 一 个 字符 的 右边 是 索引 n， 例 如 : 


第 一 行 给 出 了 字符 串 中 0..6 各 索引 的 位 置 ; 第 二 行 给 出 了 相应 的 负 素 引 。 从 加 /的 切片 由 /和 和 /之 
间 的 所 有 字符 组 成 。 


对 于 非 负 素 引 ， 如 果 上 下 都 在 边界 内 ， 切 片 长 度 就 是 两 个 索引 之 差 。 例 如 ，word[1:3] 的 长 度 
是 2。 


试图 使 用 太 大 的 索引 会 导致 错误 : 


>>> word[42] # the word only has 7 characters 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
IndexError: string index out of range 


但 是 ， 当 用 于 切片 时 ， 超 出 范围 的 切片 索引 会 被 优雅 地 处理 : 


>>> word[4:42] 
'on' 
>>> word[42:] 


Python 字符 串 不 可 以 被 更 改 一 它们 是 不 可 变 的 。 因 此 ， 赋 值 给 字符 串 索 引 的 位 置 会 导致 错 
误 : 
>>> word[0] = 'J' 


TypeError: 'str' object does not support item assignment 
>>> word[2:] = 'py' 


TypeError: 'str' object does not support item assignment 


如 果 你 需要 一 个 不 同 的 字符 串 ， 你 应 该 创建 一 个 新 的 : 


>>> 'J' + word[1:] 
' Jython' 

>>> word[:2] + 'py' 
'Pypy ' 
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>>> S = 'supercalifragilisticexpialidocious' 
>>> len(s) 
34 

请 参阅 


序列 类 型 — str, unicode, list, tuple, bytearray, buffer, xrange 字 符 串 和 下 节 描 述 的 Unicode 字 
符 串 是 序列 类 型 的 例子 ， 它 们 支持 这 种 类 型 共同 的 操作 。 字 符 串 方法 字符 串 和 Unicode 字 符 串 
都 支持 大 量 的 方法 用 于 基本 的 转换 和 查找 。 字 符 串 格式 化 这 里 描述 了 使 用 strformat() 进 行 字符 
串 格 式 化 的 信息 。 字 符 串 格式 化 操作 这 里 摘 述 了 旧式 的 字符 串 格 式 化 操作 ， 它 们 在 字符 串 和 
Unicode 字 符 串 是 % 操 作 符 的 左 操作 数 时 调用 。 


3.1.3. Unicode 字符 串 


从 Python2.0 开 始 ， 程 序 员 们 有 了 一 个 新 的 用 来 存储 文本 数据 的 类 型 : Unicode 对 象 。 它 可 以 
用 来 存储 和 处 理 Unicode 数 据 ( 见 http://www.unicode.org/)， 并 与 现 有 的 字符 串 对 象 有 良好 的 集 
成 ， 必 要 时 提供 自动 转换 。 


Unicode 的 优点 在 于 为 现代 和 古代 的 每 一 种 文字 的 每 一 个 字符 提供 了 统一 的 序号 。 以 前 ， 脚 
本 只 有 256 个 可 用 的 字符 编码 。 通 常 ， 文 本 被 绑 定 到 映射 字符 编码 的 代码 页 上 。 这 带 来 很 多 麻 
烦 ， 尤 其 是 软件 国际 化 (通常 写成 i18n 一 个 + 18 个 字符 + 'n') 。Unicode 为 所 有 脚本 定义 一 
个 代码 页 ， 从 而 解决 了 这 些 问 题 。 


在 Python 中 创建 Unicode 字 符 串 和 创建 普通 字符 串 一 样 简单 : 


>>> u'Hello World !' 
u'Hello world !' 


引号 前 面 小 写 的 心 表 示 创 建 一 个 Unicode 字 符 串 。 如 果 你 想 要 在 字符 串 中 包含 特殊 字符 ， 你 可 
以 通过 使 用 Python 的 Unicoae 转 义 编码 。 下 面 的 示例 演示 如 何 使 用 : 


>>> u'HelloNu0020World !' 
u'Hello World !' 


转 义 序列 u0020 表 示 在 给 定位 置 插 和 人 序号 值 为 0x0020 (空格 字符 ) 的 Unicode 字 符 。 


其 他 字符 就 像 Unicode 编码 一 样 被 直接 解释 为 对 应 的 编码 值 。 如 果 你 有 使 用 在 许多 西方 国家 
使 用 的 标准 Latin-1 编 码 的 字符 串 ， 你 会 发 现 编码 小 于 256 的 Unicode 字 符 和 在 Latin-1 编 码 中 的 
一 样 。 


和 普通 字符 串 一 样 ，Unicode 字 符 串 也 有 raw 模 式 。 要 使 用 Raw-Unicode-Escape 编 码 ， 必 须 
在 引号 的 前 面 加 上 'ur。 只 有 在 小 写 的 'u' 前 面 有 奇数 个 反 斜 杠 ， 才 会 用 上 面 的 UXXXX 转换 


>>> ur'HelloNu0020World !' 
u'Hello World !' 

>>> ur'Hello\\u0020World !' 
u'Hello\\\\u0020World !' 


当 你 需要 输入 很 多 反 斜 杠 时 ，raw 模式 非常 有 用 ， 这 在 正则 表达 式 中 几乎 是 必须 的 。 
除了 这 些 标准 的 编码 ，Python 提 供 了 基于 已 知 编码 来 创建 Unicode 字 符 串 的 一 整套 方法 。 


内 置 画 数 unicode() 提 供 对 所 有 已 注册 的 Unicode 编 解码 器 (编码 和 解码 ) 的 访问 。 这 些 编 解码 
器 可 以 转换 的 比较 有 名 的 编码 有 Latin-1、ASCIl/、UTF-8 和 UTF-16。 后 两 个 是 可 变 长 度 编码 ， 

它们 存储 每 个 Unicode 字 符 在 一 个 或 多 个 字 节 中 。 默 认 编码 通常 设置 为 ASCII， 此 编码 接受 0 到 
127 这 个 范围 的 编码 ， 否 则 报错 。 当 打印 、 向 文件 写 入 、 或 者 用 str() 转 换 一 个 Unicode 字 符 串 

时 ， 转 换 将 使 用 默认 编码 。 


>>> u"abc" 
u'abc' 
>>> str(u"abc") 
'abc' 
>>> u"adu" 
u'\xe4\xf6\xfc' 
>>> str(u"adu") 
Traceback (most recent call last): 
File "<stdin>", line 1, in ? 
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in 
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个 编码 名 称 作为 参数 。 编 码 名 应 该 小 写 。 


>>> u"áóü".encode('utf-8') 
"\xc3\xa4\xc3\xb6\xc3\xbc' 


如 果 有 一 个 已 知 编码 的 数据 ， 希 望 从 它 生 成 一 个 Unicode 字 符 串 ， 你 可 以 使 用 unicode() 画 数 并 
以 编码 名 作为 第 二 个 参数 。 


>>> unicode('\xc3\xa4\xc3\xb6\xc3\xbc', 'utf-8') 
u'\xe4\xf6\xfc' 


3.1.4. 列表 


Python 有 几 个 复合 数据 类 型 ， 用 来 组 合 其 他 的 值 。 最 有 用 的 是 列表 ， 可 以 写成 中 括号 中 的 一 
列 用 至 号 分 隔 的 值 。 列 表 可 以 包含 不 同类 型 的 元 素 ， 但 是 通常 所 有 的 元 素 都 具有 相同 的 类 
型 。 


>>> squares = [1, 4, 9, 16, 25] 
>>> squares 
[i 4, 9, 16, 25] 


和 字符 串 (以 及 其 它 所 有 内 建 的 序列 类 型 ) 一 样 ， 列 表 可 以 索引 和 切片 : 


>>> squares[0] # indexing returns the item 

1 

>>> squares[-1] 

25 

>>> squares[-3:] # slicing returns a new list 
[9, 16, 25] 


所 有 的 切片 操作 都 会 返回 一 个 包含 请 求 的 元 素 的 新 列表 。 这 意味 着 下 面 的 切片 操作 返回 列表 


一 个 新 的 〈 浅 ) 拷贝 副本 。 


>>> squares[:] 
[1, 4, 9, 16, 25] 


列表 也 支持 连接 这 样 的 操作 : 


>>> squares + [36, 49, 64, 81, 100] 
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100] 


与 字符 串 的 不 可 变 特 性 不 同 ， 列 表 是 可 变 的 类 型 ， 例 如 可 以 改变 它们 的 内 容 : 


>>> cubes = [1, 8, 27, 65, 125] # something's wrong here 
>>> 4 ** 3 # the cube of 4 is 64, not 65! 

64 

>>> cubes[3] = 64 # replace the wrong value 

>>> cubes 

[1, 8, 27, 64, 125] 


你 还 可 以 使 用 append() 方 法 〈 后 面 我 们 会 看 到 更 多 关于 方法 的 内 容 ) 在 列表 的 末尾 添加 新 的 


元 素 : 


>>> cubes.append(216) # add the cube of 6 
>>> cubes.append(7 ** 3) # and the cube of 7 
>>> cubes 

[1, 8, 27, 64, 125, 216, 343] 


给 切片 赋值 也 是 可 以 的 ， 此 操作 甚至 可 以 改变 列表 的 大 小 或 者 清空 它 : : 


>>> letters = ['a', 'b', 'c', 'd', 'e', 'f', 'g'] 
>>> letters 

ree Mot, Met, PCP, Few, Tip Perl 

>>> # replace some values 

>>> letters[2:5] = ['C', 'D', 'E'] 

>>> letters 

ree We. Ju. Uy. MEY, Mirth Sey] 

>>> # now remove them 

>>> letters[2:5] = [] 

>>> letters 

ae ope epu Se 

>>> # clear the list by replacing all the elements with an empty list 
>>> letters[:] = [] 

>>> letters 


[] 


ABW Mlen()tHis AFI : 


>>> letters — [Lal DU IC 
>>> len(letters) 
4 


WRATARE 《创建 包含 其 他 列表 的 列表 ) ， 例 如 : 


cee cl [vey Ves e] 
>>> n= [1, 2, 3] 

>>> x = [a, n] 

>>> X 

EE EE Toe, CN [lly s Sill 
>>> x[0] 

Lm, “Wey Merl 

>>> x[0][1] 

'b! 


3.2. 编程 第 一 步 


当然 ， 我 们 可 以 将 Python 用 于 比 计算 2 加 2 更 复 末 的 任务 。 例 如 ， 我 们 可 以 写 一 个 生成 辈 波 那 
契 初 始 子 序列 的 程序 ， 如 下 所 示 : 


>>> # Fibonacci series: 
. # the sum of two elements defines the next 
. a, b=0, 1 
>>> while b < 10: 
print b 
a, b = b, a+b 


co 010 9 F H - 


本 示例 介绍 了 几 种 新 功能 。 


。 第 一 行 包括 了 一 个 多 重 赋值 : 变量 a 和 b 同 时 获得 新 的 值 0 和 1。 最 后 一 行 又 这 祥 使 用 了 一 
次 ， 说 明 等 号 右边 的 表达 式 在 赋值 之 前 首先 被 完全 解析 。 右 侧 表 达 式 是 从 左 到 右 计 算 
的 。 


e 只 要 条 件 〈 这 里 是 b<10) 为 真 ，[while]( 芍 循环 反复 执行 。 在 Python 中 ， 和 C 一 样 ， 任 何 
非 需 整数 值 都 为 真 ; 雾 为 假 。 循 环 条 件 也 可 以 是 一 个 字符 串 或 者 列表 ， 实 际 上 可 以 是 任 
何 序列 ; 长 度 不 为 需 的 序列 为 真 ， 空 序列 为 假 。 示 例 中 使 用 的 测试 是 一 个 简单 的 比较 。 


标准 比较 运算 符 与 C=" 的 写法 一 样 : < GINE), => CAT), == (SF), <= (小 于 
REF) ，>= 〈 大 于 或 等 于 ) 和 != (NSF). 


。 循环 体 是 缩 进 的 : 缩 进 是 Python 分 组 语句 的 方式 。 交 互 式 输 入 时 ， 你 必须 为 每 个 缩 进 的 
行 输入 一 个 tab 或 (多 个 ) 空格 。 实 践 中 你 会 用 文本 编辑 器 来 编写 复 条 的 Python 程序 ; 
所 有 说 得 过 去 的 文本 编辑 器 都 有 自动 缩 进 的 功能 。 交 互 式 输入 复合 语句 时 ， 最 后 必须 在 
跟随 一 个 空 行 来 表示 结束 (因为 解析 器 无 法 猜测 你 什么 时 候 已 经 输入 最 后 一 行 ) 。 注 意 
基本 块 内 的 每 一 行 必须 按 相同 的 量 缩 进 。 


e print 语 名 输出 传 给 它 的 表达 式 的 值 。 与 仅仅 输出 你 想 输 出 的 表达 式 不 同 (就 像 我 们 在 前 
面 计算 器 的 例子 中 所 做 的 ) ， 它 可 以 输出 多 个 表达 式 和 字符 串 。 打 印 出 来 的 字符 串 不 包 
含 引号 ， 项 目 之 间 会 插入 一 个 空格 ， 所 以 你 可 以 设置 漂亮 的 格式 ， 像 这 样 : 


>>> i = 256*256 
>>> print 'The value of i is', i 
The value of i is 65536 


尾部 的 逗号 可 以 避免 输出 换行 符 : 


>>> a, b = 0, 1 

>>> while b < 1000: 
print b, 
a, b = b, atb 


11235 8 13 21 34 55 89 144 233 377 610 987 


注意 ， 如 果 最 后 一 行 没有 结束 ， 解 释 器 会 插入 一 个 新 行 〈 在 打印 下 一 个 提示 符 之 前 ) 。 


脚注 
[1] 因为 的 优先 级 高 于 -， 所 以 -32 将 解释 为 -(32) 且 结果 为 -9。 为 了 避免 这 点 并 得 到 9， 
你 可 以 使 用 (-3)2。 


| [21| 往 其 它 语言 不 同 ， 特 殊 字 符 例 如 \n 在 单 引 号 (...') 和 双 引 号 ("...") 中 具有 相同 的 含义 。 两 者 
唯一 的 区 别 是 在 单 引 号 中 ， 你 不 需要 转 义 "(但 你 必须 转 义 \)， 反 之 亦 然 。 | |-----|-----| 


4. 控制 流 


除了 前 面 介 绍 的 while 语 句 ，Python 也 有 其 它 语言 常见 的 流程 控制 语句 ， 但 是 稍 有 不 一 样 。 


4.1. if 语句 
也 许 最 知名 的 语句 类 型 是 if 语句 。 例 如 : 


>>> x = int(raw_input("Please enter an integer: ")) 
Please enter an integer: 42 
>>> if x < 0: 
x = 0 
print 'Negative changed to zero' 
. elif x == 0: 
print 'Zero' 
. elif x == 1: 
print 'Single' 
. else: 
print 'More' 


More 


"EUB*EA eB, else dEi kg F'elifE'else (HAS, DLA ORE SO 
深 的 缩 进 。if...elif...elif... 序 列 用 于 替代 其 它 语言 中 的 switch 或 case 语 句 。 


4.2. fori& ^3] 


Python 中 的 for 语 句 和 你 可 能 熟悉 的 C 或 Pascal 中 的 有 点 不 同 。 和 常见 的 依据 一 个 等 差 数列 迭 
代 (an Pascal) ， 或 让 用 户 能 够 自 定义 迭代 步骤 和 停止 条 件 (如 C) 不 一 样 ，Python 的 for 语 
句 按照 元 素 出 现 的 顺序 迭代 任何 序列 〈 列 表 或 字符 串 ) 。 例 如 (没有 双关 意 ) 


>>> # Measure some strings: 
. words = ['cat', 'window', 'defenestrate' ] 
>>> for w in words: 
print w, len(w) 
cat 3 
window 6 
defenestrate 12 


如 果 要 在 循环 内 修改 正在 迭代 的 序列 〈 例 如 ， 复 制 所 选 的 项 目 ) ， 建 议 首先 制作 副本 。 人 迭代 
序列 不 会 隐 式 地 创建 副本 。 使 用 切片 就 可 以 很 容易 地 做 到 : 


>>> for w in words[:]: # Loop over a slice copy of the entire list. 
if len(w) > 6: 
words.insert(0, w) 
>>> words 


['defenestrate', 'cat', 'window', 'defenestrate'] 


4.3. range()E32 


JI SR RES RRE DAFF] AERA) 7518, CHERASERRAATINI 
RR: 


>>> range(10) 
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 


给 定 的 终点 永远 不 会 在 生成 的 列表 中 ; range(10) 生 成 一 个 包含 10 个 值 的 链表 ， 索 引 的 值 和 对 
应 元 素 的 值 相 等 。 也 可 以 让 range 图 数 从 另 一 个 数值 开始 ， 或 者 可 以 指定 一 个 不 同 的 步 进 值 
(其 至 是 负数 ， 有 时 这 也 被 称 为 ' 步 长 ') 


>>> range(5, 10) 
[57936787 8, 9] 

>>> range(0, 10, 3) 

[Om 37) 6; 9] 

>>> range(-10, -100, -30) 
[-10, -40, -70] 


若 要 依据 索引 迭代 序列 ， 你 可 以 结合 使 用 range() 和 len()， 如 下 所 示 : 


>>> a = ['Mary', 'had', 'a', 'little', 'lamb'] 
>>> for i in range(len(a)): 
print i, a[i] 
0 Mary 
1 had 
2a 


3 little 
4 lamb 


然而 ， 在 大 部 分 情况 下 使 用 enumerate() 函 数 会 更 加 方便 ， 请 参见 循环 的 技巧 。 


4.4. break 和 continue 语 句 ， 以 及 循环 中 else 子 句 


break 语 句 和 C 中 的 类 似 ， 用 于 跳出 最 近 的 for 或 while 循 环 。 


循环 语句 可 以 有 一 个 else 子 句 ; 当 (for) 循环 迭代 完整 个 列表 或 (while) 循环 条 件 变 为 假 ， 


而 非 由 break 语 句 终 止 时 ， 它 会 执行 。 下 面 循环 搜索 质数 的 代码 例 示 了 这 一 点 : 


>>> for n in range(2, 10): 
for x in range(2, n): 
if n % x == 0: 
print n, 'equals', x, '*', n/x 
break 
else: 
# loop fell through without finding a factor 
print n, 'is a prime number' 


is a prime number 
is a prime number 
equals 2 * 2 
is a prime number 
equals 2 * 3 
is a prime number 
equals 2 * 4 
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equals 3 * 3 


(是 的 ， 这 是 正确 的 代码 。 看 仔细 : else 子 句 属于 for 循 环 ， 不 属于 if 语句 。) 


与 循环 一 起 使 用 时 ，else 子 句 与 try 语 句 的 else 子 句 比 与 放 语 句 的 具有 更 多 的 共同 点 :try 语句 的 
else 子 句 在 未 出 现 异常 时 运行 ， 循 环 的 else 子 句 在 未 出 现 break 时 运行 。 更 多 关于 try 语 句 和 异 


常 的 内 容 ， 请 参见 处 理 异 常 。 


continue 语 句 ， 也 是 从 C 语 言 借 来 的 ， 表 示 继 续 下 一 次 迭代 : 


>>> for num in range(2, 10): 
if num % 2 == O0: 
print "Found an even number", num 
continue 
print "Found a number", num 
Found an even number 2 
Found a number 3 
Found an even number 4 
Found a number 5 
Found an even number 6 
Found a number 7 
Found an even number 8 
Found a number 9 


4.5. passi& 4 


pass 语 句 什么 也 不 做 。 它 用 于 语法 上 必须 要 有 一 条 语句 ， 但 程序 什么 也 不 需要 做 的 场合 。 例 


ap : 


>>> while True: 
pass # Busy-wait for keyboard interrupt (Ctrl+C) 


它 通 常用 于 创建 最 小 的 类 : 


>>> class MyEmptyClass: 
pass 


另 一 个 使 用 pass 的 地 方 是 编写 新 代码 时 作为 函数 体 或 控制 体 的 占 位 符 ， 这 让 你 在 更 抽象 层次 
上 思考 。 pass 语 知 句 将 被 默默 地 忽略 : : 


>>> def initlog(*args): 
pass # Remember to implement this! 


4.6.xE WR 
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>>> def fib(n): # write Fibonacci series up to n 
""Print a Fibonacci series up to n.""" 
a, b=0, 1 
while a « n: 
print a, 
a, b = b, a+b 


>>> # Now call the function we just defined: 
. fib(2000) 
01123 5 8 13 21 34 55 89 144 233 377 610 987 1597 


AhtzEdefSD A ERARBAZE SL, EUREN SUELE E S ESBBISE SA UTR. 2B Aes ath 
的 语句 从 下 一 行 开始 ， Busan 


函数 体 的 第 一 行 可 以 是 一 个 可 选 的 字符 串 文 本 UFR RSMAS, RE 
为 qocstring。 (更 多 关于 docstrings 的 内 容 可 以 在 文档 字符 串 一 节 中 找到 。) 有 工具 使 用 
docstrings 自动 生成 在 线 的 或 可 打印 的 文档 ， 或 者 让 用 户 在 代码 中 交互 浏览 ; 在 您 编写 的 代码 
中 包含 docstrings 是 很 好 的 做 法 ， 所 以 让 它 成 为 习惯 吧 。 


执行 一 个 辑 数 会 引入 一 个 用 于 函数 的 局 部 变量 的 新 符号 表 。 更 确切 地 说 ， 函 数 中 的 所 有 的 赋 
值 都 是 将 值 存储 在 局 部 符号 表 ; 而 变量 引用 首先 查找 局 部 符号 表 ， 然 后 是 上 层 函 数 的 局 部 符 
号 表 ， 然 后 是 全 局 符号 表 ， 最 后 是 内 置 名 字 表 。 因 此 ， 在 函数 内 部 全 局 变量 不 能 直接 赋值 
(除非 在 一 个 global 语 句 中 命名 ) ， 虽 然 可 以 引用 它们 。 


PK 2M 73 FH B3 32 SE AR AA Sl AR A AT Se; 因此 ， 参 数 的 传递 使 用 传 
值 调用 〈 这 里 的 值 始终 是 对 象 的 引用 ， 不 是 对 象 的 值 ) . [11— C ESSIUR FH 5 — CERRO, R 
为 该 调用 创建 一 个 新 的 局 部 符号 表 。 


图 数 定义 会 在 当前 符号 表 内 引入 孙 数 名 。 辑 数 名 对 应 值 的 类 型 是 解释 器 可 识别 的 用 户 自 定义 
玉 数 。 此 值 可 以 分 配给 另 一 个 名 称 ， 然 后 也 可 作为 范 数 。 这 是 通用 的 重 命 名 机 制 : 


>>> fib 

<function fib at 10042ed0> 
>>> f = fib 

>>> f(100) 

0112358 13 21 34 55 89 


如 果 你 使 用 过 其 他 语言 ， 你 可 能 会 反对 说 : fib ze — ^ ESZAG mE -DE TEF) AXE 
并 不 返回 任何 值 。 事 实 上 ， 没 有 return 语 句 的 男 数 也 返回 一 个 值 ， 尽 管 是 一 个 很 无 聊 的 值 。 此 
值 被 称 为 None ( 它 是 一 个 内 置 的 名 称 ) 。 如 果 None 只 是 唯一 的 输出 ， 解 释 器 通常 不 会 打印 
出 来 。 如 果 你 真 的 想 看 到 这 个 值 ， 可 以 使 用 print 语句 : 


>>> fib(0) 
>>> print fib(0) 
None 


写 一 个 画 数 返回 菲 波 那 契 数列 的 列表 ， 而 不 是 打印 出 来 ， 非 常 简单 : 


>>> def fib2(n): # return Fibonacci series up to n 
"""Return a list containing the Fibonacci series up to n.""" 
result - [] 
a, b-0,41 
while a « n: 
result.append(a) # see below 
a, b = b, a+b 
return result 


>>> f100 = fib2(100) # call it 
>>> f100 # write the result 
[0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89] 


此 示例 中 ， 像 往常 一 样 ， 演 示 了 一 些 新 的 Python 功能 : 


e return 语 句 从 本 数 中 返回 一 个 值 。 不 带 表 达 式 参数 的 return 返 回 None。 画 数 直 接 结 束 后 也 
返回 None。 

e 语句 resultappend(a) 调 用 列表 对 象 result 的 一 个 方法 。 方 法 是 隶属 于 ' 某 个 对 象 的 函数 ， 
被 命名 成 obj.methodname 的 形式 ， 其 中 obj 是 某 个 对 象 (或 是 一 个 表达 式 ) , 
methodname 是 由 对 象 类 型 定义 的 方法 的 名 称 。 不 同类 型 定义 了 不 同 的 方法 。 不 同类 型 的 
方法 可 能 具有 相同 的 名 称 ， 而 不 会 引起 歧义 。 (也 可 以 使 用 class 定义 你 自己 的 对 象 类 型 


和 方法 ， 请 参见 类 ) 本 例 中 所 示 的 append() 方 法 是 列表 对 象 定 义 的 。 它 在 列表 的 末尾 添 
加 一 个 新 的 元 素 。 在 本 例 中 它 等 同 于 result=result+[a]， 但 效率 更 高 。 


4.7. 更 多 天 于 定义 函数 


可 以 定义 具有 可 变数 目的 参数 的 函数 。 有 三 种 形式 ， 也 可 以 结合 使 用 。 


4.7.1. 默 认 参 数值 


最 有 用 的 形式 是 指定 人 这 种 方法 创建 的 函数 被 调用 时 ， 可 以 带 有 比 
定义 的 要 少 的 参数 。 例 如 : 


def ask_ok(prompt, retries=4, complaint='Yes or no, please!'): 
while True: 

ok = raw_input(prompt) 

if ok in ('y', 'ye', 'yes!): 
return True 

if ok in ('n', 'no', 'nop', 'nope'): 
return False 

retries - retries - 1 

if retries < 0: 
raise IOError('refusenik user') 

print complaint 


这 个 函数 可 以 通过 几 种 方式 调用 : 


e 只 给 出 强制 参数 : ask ok (' Doyoureallywanttoquit?") 
e 给 出 一 个 可 选 的 参数 : ask ok ('OKtooverwritethefile?',2) 
e 或 者 给 出 所 有 的 参数 : ask ok (‘OKtooverwritethefile?’,2,'\Comeon,onlyyesorno!’) 


此 示例 还 引入 了 in 关键 字 。 它 测试 一 个 序列 是 否 包含 特定 的 值 。 
默认 值 在 定义 域 中 的 函数 定义 的 时 候 计 算 ， 例 如 


i=5 


def f(arg-i): 
print arg 


将 打印 5。 


重要 的 警告 : 默认 值 只 计算 一 次 。 这 使 得 默认 值 是 列表 、 字 典 或 大 部 分 类 的 实例 时 会 有 所 不 
同 。 例 如 ， 下 面 的 函数 在 后 续 调用 过 程 中 会 累积 传 给 它 的 参数 : 


def f(a, L=[]): 
L.append(a) 
return L 


print f(1) 
print f(2) 
print f(3) 


如 果 你 不 想 默认 值 在 随后 的 调用 中 共享 ， 可 以 像 这 数 : 


def f(a, L=None): 
if L is None: 
zo 
L.append(a) 
return L 


4.7.2. 天 键 字 参数 


函数 也 可 以 通过 kwarg=value 形 式 的 关键 字 参 数 调 用 。 例 如 ， 下 面 的 丁 数 : 


def parrot(voltage, state='a stiff', action='voom', type='Norwegian Blue'): 


print "-- This parrot wouldn't", action, 

print "if you put", voltage, "volts through it." 
print "-- Lovely plumage, the", type 

print "-- It's", state, "!" 


接受 一 个 必 选 参数 (voltage) 和 三 个 可 选 参数 (state,action 和 type) 。 可 以 用 下 列 任 意 一 种 
方式 调用 这 个 函数 
parrot(1000) # 1 positional argument 
parrot(voltage=1000) # 1 keyword argument 
parrot(voltage-1000000, action='VOOOOOM' ) # 2 keyword arguments 
parrot(action='VO0000M', voltage-1000000) # 2 keyword arguments 
parrot('a million', 'bereft of life', 'jump') # 3 positional arguments 
parrot('a thousand', state='pushing up the daisies') # 1 positional, 1 keyword 


但 下 面 的 所 有 调用 将 无 效 : 


parrot() # required argument missing 

parrot(voltage=5.0, 'dead') # non-keyword argument after a keyword argument 
parrot(110, voltage-220) 4 duplicate value for the same argument 
parrot(actor='John Cleese') # unknown keyword argument 
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数 接受 的 某 个 参数 相 匹 配 (例如 actor 不 是 parrot 函 数 的 有 效 参 数 ) ， 它 们 的 顺序 并 不 重要 。 这 
也 包括 非 可 选 参数 (例如 parrot(voltage=1000) 也 是 有 效 的 ) 。 任 何 参数 都 不 可 以 多 次 赋值 。 

下 面 的 示例 由 于 这 种 限制 将 失败 : 


>>> def function(a): 
pass 


>>> function(0, a=0) 
Traceback (most recent call last): 
File "<stdin>", line 1, in ? 
TypeError: function() got multiple values for keyword argument 'a' 


当 最 后 一 个 形 参 以 name 形 式 出 现时 ， 它 接收 一 个 字典 ( 见 映 射 类 型 一 字典 )， 该 字典 包含 了 所 
有 未 出 现在 形式 参数 列表 中 的 关键 字 参 数 。 它 还 可 能 与 narme 形 式 的 参数 (在 下 一 小 节 中 所 
W) 组 合 使 用 ，name 接 收 一 个 包含 所 有 没有 出 现在 形式 参数 列表 中 的 位 置 参 数 元 组 。 
(*name 必 须 出 现在 name 之 前 。) 例 如 ， 如 果 我 们 定义 这 桩 的 范 数 : 


def cheeseshop(kind, *arguments, **keywords): 
print "-- Do you have any", kind, "?" 
print "-- I'm sorry, we're all out of", kind 
for arg in arguments: 
print arg 
print "-" * 40 
keys = sorted(keywords.keys()) 
for kw in keys: 
print kw, ":", keywords[kw] 


它 可 以 这 样 调用 : 


cheeseshop("Limburger", "It's very runny, sir.", 
"It's really very, VERY runny, sir.", 
shopkeeper='Michael Palin', 
client="John Cleese", 
sketch="Cheese Shop Sketch") 


当然 它 会 打印 : 


-- Do you have any Limburger ? 

-- I'm sorry, we're all out of Limburger 
It's very runny, sir. 

It's really very, VERY runny, sir. 


client : John Cleese 
shopkeeper : Michael Palin 
sketch : Cheese Shop Sketch 


注意 在 打印 关键 字 参数 之 前 ， 通 过 对 关键 字 字 典 keys() 方法 的 结果 进行 排序 ， 生 成 了 关键 字 
参数 名 的 列表 ; 如 果 不 这 样 做 ， 打 印 出 来 的 参数 的 顺序 是 未 定义 的 。 
4.7.3. 任 意 参 数列 表 


最 后 ， 一 个 最 不 常用 的 场景 是 让 画 数 可 以 被 可 变 个 数 的 参数 调用 。 这 些 参数 被 放 在 一 个 元 组 
( 见 元 组 和 序列 ) 中 。 在 可 变 个 数 的 参数 之 前 ， 可 以 有 雳 到 多 个 普通 的 参数 。 


def write_multiple_items(file, separator, *args): 
file.write(separator.join(args)) 


4.7.4. 参数 列表 的 分 拆 


当 传 递 的 参数 已 经 是 一 个 列表 或 元 组 时 ， 情 况 与 之 前 相反 ， 你 要 分 拆 这 些 参 数 ， 因 为 函数 调 
用 要 求 独立 的 位 置 参 数 。 例 如 ， 内 置 的 range() 芳 数 期 望 单独 的 start 和 stop 人 参数。 如果 它 们 不 
是 独立 的 ， 画 数 调用 时 使 用 *- 操 作 符 将 参数 从 列表 或 元 组 中 分 拆 开 来 : 


>>> range(3, 6) # normal call with separate arguments 

[3, 4, 5] 

>>> args = [3, 6] 

>>> range(*args) # call with arguments unpacked from a list 
[3, 4, 5] 


以 同样 的 方式 ， 可 以 用 *- 操 作 符 让 字典 传递 关键 字 参 数 : 


>>> def parrot(voltage, state='a stiff', action='voom'): 
print "-- This parrot wouldn't", action, 
print "if you put", voltage, "volts through it.", 
print “Ets”, state, "I" 


>>> d = {"voltage": "four million", "state": "bleedin' demised", "action": "VOOM"} 
>>> parrot(**d) 
-- This parrot wouldn't VOOM if you put four million volts through it. E's bleedin' demis 


a = 








4.7.5. lambda iX xX 
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3, lambda 函数 可 以 从 包含 范围 引用 变量 : 


>>> def make_incrementor(n): 
return lambda x: x * n 


>>> f = make incrementor(42) 
>>> f(0) 


>>> f(1) 


上 面 的 示例 使 用 lambda Rik zo&IBI — ^ ESZA,— 3 — 7 FEX ZECRE— TP) ASAE : 


>>> pairs = [(1, 'one'), (2, 'two'), (3, 'three'), (4, 'four')] 
>>> pairs.sort(key-lambda pair: pair[1]) 

>>> pairs 

[(4, 'four'), (1, 'one'), (3, 'three'), (2, 'two')] 


4.7.6. 文档 字符 串 
有 关 文 档 字符 串 的 内 容 和 格式 的 约定 正 不 断 涌现 。 


第 一 行 永远 应 该 是 对 象 用 途 的 简短 、 精 确 的 总 述 。 为 了 简单 起 见 ， 不 应 该 明确 的 陈述 对 象 的 
名 字 或 类 型 ， 因 为 这 些 信息 可 以 从 别 的 途径 了 解 到 《除非 这 个 名 字 碰 巧 就 是 描述 这 个 画 数 操 
作 的 动词 ) 。 这 一 行 应 该 以 大 写字 母 开 头 ， 并 以 句号 结尾 。 


如 果 在 文档 字符 串 中 有 更 多 的 行 ， 第 二 行 应 该 是 空白 ， 在 视觉 上 把 摘要 与 剩余 的 描述 分 离开 
来 。 以 下 各 行 应 该 是 一 段 或 多 段 描述 对 象 的 调用 约定 、 其 副作用 等 。 


Python 解释 器 不 会 从 多 行 的 文档 字符 串 中 去 除 缩 进 ， 所 以 必要 的 时 候 处 理 文档 字 符 串 的 工具 
应 当 自己 清除 缩 进 。 这 通过 使 用 以 下 约定 可 以 达到 。 第 一 行 之 后 的 第 一 个 非 空 行 字 符 串 确定 
整个 文档 字符 串 的 缩 进 的 量 。 (我 们 不 用 第 一 行 是 因为 它 通常 紧 靠 着 字符 串 起 始 的 引号 ， 其 
缩 进 格 式 不 明晰 。) 所 有 行 起 始 的 等 于 缩 进 量 的 空格 都 将 被 过 滤 掉 。 不 应 该 发 生 缩 进 较 少 的 
行 ， 但 如 果 他 们 发 生 ， 应 去 除 所 有 其 前 导 空白 。 留 白 的 长 度 应 当 等 于 扩展 制 表 符 的 宽度 GE 
常 是 8 个 空格 ) 。 


这 里 是 一 个 多 行文 档 字符 串 的 示例 : 


>>> def my_function(): 
"""Do nothing, but document it. 


No, really, it doesn't do anything. 
pass 


>>> print my function. doc 


Do nothing, but document it. 


No, really, it doesn't do anything. 


4.8. 插曲 : 编码 风格 


既然 你 将 要 编写 更 长 更 复杂 的 Python 片段 ， 这 是 谈 一 谈 编码 风格 的 好 时 机 。 大 多 数 语言 可 
以 编写 成 (或 者 更 准确 地 讲 ， 格 式 化 成 ) 不 同 的 风格 ; 其 中 有 一 些 会 比 其 他 风格 更 具 可 读 
性 。 让 你 的 代码 对 别人 更 易 读 永远 是 个 好 想法 ， 养 成 良好 的 编码 风格 对 此 有 很 大 的 帮助 。 


对 于 Python ims, PEP 8 已 成 为 大 多 数 项 目 遵循 的 风格 指南 ; 它 给 出 了 一 个 高 度 可 读 ， 视 
觉 友好 的 编码 风格 。 每 个 Python 开发 者 应 该 阅读 一 下 ; 这 里 是 为 你 提取 出 来 的 最 重要 的 要 


mw 


。 使 用 4 个 空格 的 缩 进 ， 不 要 使 用 制 表 符 。 


4 个 空格 是 小 缩 进 (允许 更 深 的 馈 套 ) 和 大 缩 进 〈 易 于 阅读 ) 之 间 很 好 的 折衷 。 制 表 符 会 引起 
混乱 ， 最 好 弃 用 。 


e 折 行 以 确保 其 不 会 超过 79 个 字符 。 
这 有 助 于 小 显示 器 用 户 阅读 ， 也 可 以 让 大 显示 器 能 并 排 显示 几 个 代码 文件 。 
。 使 用 空 行 分 隔 画 数 和 类 ， 以 及 函数 内 的 大 块 代码 。 
。 如 果 可 能 ， 注 释 独占 一 行 。 
e 使 用 docstrings。 
。 运算 符 周转 和 逗号 后 面 使 用 空格 ， 但 是 括号 里 侧 不 加 空格 : a=f(1,2)+g(3,4)。 


e 命名 您 的 类 和 冰 数 一致 ; 惯例 是 使 用 驼峰 命名 法 的 类 和 使 用 
lower case with underscores JRA AE . 。 始 终 使 用 self 作 为 方法 的 第 一 个 参数 的 名 
TR (关于 类 和 方法 的 更 多 信息 请 参见 初 识 类 ) 。 


。 如 果 希 望 你 的 代码 在 国际 化 环境 中 使 用 ， 不 要 使 用 奇特 的 编码 。 简 单 的 ASCII 在 任何 情 
况 下 永远 工作 得 最 好 。 


脚注 


| [ 们 | 实际 上 ， 更 好 的 描述 是 通过 对 象 的 引用 调用 ， 因 为 如 果 传 递 的 是 一 个 可 变 的 对 象 ， 那 么 
调用 者 可 以 看 到 被 调用 者 对 它 所 做 的 任何 改变 (插入 到 一 个 列表 中 元 素 ) 。 | |-----|-----| 


5. 数据 结构 


本 章 详细 讲述 你 已 经 学 过 的 一 些 知识 ， 并 增加 一 些 新 内 容 。 


5.1. 深入 列表 

列表 数据 类 型 还 有 更 多 的 方法 。 这 里 是 列表 对 象 的 所 有 方法 : 

list.append(x) 添加 一 个 元 素 到 列表 的 末尾 ; 相当 于 allen(a):]=[x]。 

list.extend(L) 将 给 定 列表 中 的 所 有 元 素 附 加 到 另 一 个 列表 的 末尾 ; 相当 于 allen(a):]=L。 


list.insert(/, x) 在 给 定位 置 插入 一 个 元 素 。 第 一 个 参数 是 准 各 插入 到 其 前 面 的 那个 元 素 的 索 
引 ， 所 以 a.insert(0,x) 在 列表 的 最 前 面 插 入，a.insert(len(a),x) 相当 于 a.append(x). 


list.remove(x) 删除 列表 中 第 一 个 值 为 x 的 元 素 。 如 果 没 有 这 样 的 元 素 将 会 报错 。 


list.pop([i]) 删除 列表 中 给 定位 置 的 元 素 并 返回 它 。 如 果 未 指定 索引 ，a.pop() 删除 并 返回 列表 
中 的 最 后 一 个 元 素 。 (i 两 边 的 方 括号 表示 这 个 参数 是 可 选 的 ， 而 不 是 要 你 输入 方 括号 。 你 会 
在 Python 参考 库 中 经 常 看 到 这 种 表示 法 )。 


list.index(x) 返回 列表 中 第 一 个 值 为 x 的 元 素 的 索引 。 如 果 没 有 这 样 的 元 素 将 会 报错 。 
list.count(x) 返回 列表 中 x 出 现 的 次 数 。 


list.sort(cmp-None, key=None, reverse=False) 原 地 排序 列表 中 的 元 素 (参数 可 以 用 来 自 定 
义 排 序 方法 ， 参 考 sorted() 的 更 详细 的 解释 ) 。 


list.reverse() 原 地 反 转 列表 中 的 元 素 。 
使 用 了 列表 大 多 数 方法 的 例子 : 


>>> a = [66.25, 333, 333, 1, 1234.5] 

>>> print a.count(333), a.count(66.25), a.count('x') 
210 

>>> a.insert(2, -1) 

>>> a.append(333) 

>>> a 

[66.25, 333, -1, 333, 1, 1234.5, 333] 

>>> a.index(333) 


>>> a.remove(333) 

>>> a 

[66.25, -1, 333, 1, 1234.5, 333] 
>>> a.reverse() 

>>> a 

[333, 1234.5, 1, 333, -1, 66.25] 
>>> a.sort() 

>>> a 

[-1, 1, 66.25, 333, 333, 1234.5] 
>>> a.pop() 

1234.5 

>>> a 

[-1, 1, 66.25, 333, 333] 


你 可 能 已 经 注意 到 像 insert, remove KA sort 之 类 的 方法 只 修改 列表 而 没有 返回 值 打印 出 来 -- 
它们 其 实 返 回 了 默认 值 None。 这 是 Python 中 所 有 可 变数 据 结构 的 设计 原则 。 


5.1.1. 用 列表 作为 栈 


列表 方法 使 得 将 List 当 作 栈 非常 容易 ， 最 先进 入 的 元 素 最 后 一 个 取出 (后 进 先 出 ) 。 使 用 
append() 将 元 素 添 加 到 栈 项 。 使 用 不 带 索 引 的 pop() 从 栈 顶 取出 元 素 。 例 如 : 


>>> stack = [3, 4, 5] 
>>> stack.append(6) 
>>> stack.append(7) 
>>> stack 

ey GO, Sy By 2A 

>>> stack. pop() 


>>> stack 
[3, 4, 57 6] 
>>> stack.pop() 


>>> stack.pop() 


>>> stack 
[3, 4] 


5.1.2. 用 列表 作为 队列 


也 可 以 将 列表 当 作 队列 使 用 ， 此 时 最 先进 入 的 元 素 第 一 个 取出 (先进 先 出 ) ; 但 是 列表 用 作 
此 目的 效率 不 高 。 在 列表 的 末尾 添加 和 弹出 元 素 非常 快 ， 但 是 在 列表 的 开头 插入 或 弹出 元 素 
却 很 慢 (因为 所 有 的 其 他 元 素 必须 向 后 移 一 位 )。 


如 果 要 实现 一 个 队列 ， 可 以 使 用 collections.deque， 它 设计 的 目的 就 是 在 两 端 都 能 够 快速 添加 
和 弹出 元 素 。 例 如 : 


>>> from collections import deque 
>>> queue = deque(["Eric", "John", "Michael"]) 


>>> queue.append("Terry") # Terry arrives 

>>> queue.append("Graham" ) # Graham arrives 

>>> queue.popleft() # The first to arrive now leaves 
HEUS 

>>> queue.popleft() 4 The second to arrive now leaves 

' John' 

>>> queue # Remaining queue in order of arrival 


deque(['Michael', 'Terry', 'Graham']) 


5.1.3. rj tz TR 
有 三 个 内 置 画 数 与 列表 一 起 使 用 时 非常 有 用 : filter()、map() 和 reduce()。 


filter(function,sequence) 返 回 的 序列 由 function(item) 结 果 为 真 的 元 素 组 成 。 如 果 sequence 是 
一 个 字符 串 或 元 组 ， 结 果 将 是 相同 的 类 型 ; 否则 ， 结 果 将 始终 是 一 个 列表 。 例 如 ， 若 要 计算 
一 个 不 能 被 2 和 3 整除 的 序列 : 


>>> def f(x): return x%2 != 0 and x%3 != 0 
>>> filter(f, range(2, 25)) 


[5, 7, 33, 13, 17, 19, 23] 


map(function,sequence) 为 序列 中 的 每 一 个 元 素 调用 function(item) EAH ik Gt RAN TUR. 
例如 ， 计 算 列 表 中 所 有 元 素 的 立方 值 : 


>>> def cube(x): return x*x*x 
>>> map(cube, range(1, 11)) 


[1, 8, 27, 64, 125, 216, 343, 512, 729, 1000] 


可 以 传人 多 个 序列 ; 此 时 ， 传 入 的 函数 也 必须 要 有 和 序列 数目 相同 的 参数 ， 执 行 时 会 依次 用 
各 序列 上 对 应 的 元 素来 调用 男 数 (如 果 某 个 序列 比 另外 一 个 短 ， 就 用 None RE) 。 例 如 : 


>>> seq = range(8) 
>>> def add(x, y): return x+y 


>>> map(add, seq, seq) 
[0, 2, 4, 6, 8, 10, 12, 14] 


reduce(function,sequence) H3k[g]| —4^ a, "€ Bi ZEE WANA 98 T 763833 AR function, $5 
后 再 以 返回 的 结果 和 下 一 个 元 素 继续 调用 ， 依 此 执行 下 去 。 例 如 ， 若 要 计算 数字 1 到 10 的 总 
和 : 


>>> def add(x,y): return x+y 
>>> reduce(add, range(1, 11)) 
55 
如 果 序 列 中 只 有 一 个 元 素 ， 将 返回 这 个 元 素 的 值 ; 如 果 序 列 为 空 ， 则 引发 异常 。 


可 以 传人 第 三 个 参数 作为 初始 值 。 在 这 种 情况 下 ， 如 果 序 列 为 空 则 返回 起 始 值 ， 否 则 会 首先 
以 初始 值 和 序列 的 第 一 个 元 素 调 用 function， 然 后 是 返回 值 和 下 一 个 元 素 ， 依 此 执行 下 去 。 例 
如 ， 


>>> def sum(seq): 
def add(x,y): return x+y 
return reduce(add, seq, 0) 


>>> sum(range(1, 11)) 
55 


>>> sum([]) 
0 


不 要 使 用 示例 中 定义 的 sum() : 由 于 计算 数字 的 总 和 是 一 个 如 此 常见 的 需求 ，Python 提 供 了 内 
置 的 函数 sum(sequence)， 其 工作 原理 和 示例 几乎 一 样 。 
5.1.4. 列表 推导 式 


列表 推导 式 提供 了 一 个 生成 列表 的 简洁 方法 。 应 用 程序 通常 会 从 一 个 序列 的 每 个 元 素 的 操作 
结果 生成 新 的 列表 ， 或 者 生成 满足 特定 条 件 的 元 素 的 子 序列 。 


例如 ， 假 设 我 们 想 要 创建 一 个 列表 squares : 


>>> squares = [] 
>>> for x in range(10): 
squares.append(x**2) 


>>> squares 
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81] 


我 们 可 以 用 下 面 的 方式 得 到 同样 的 结 


squares = [x**2 for x in range(10)] 


ix 48 4 F squares =map(lambdax:x**2,range(10)), (B= # f$ j5 TI ie 


列表 推导 式 由 括号 括 起 来 ， 括 号 里 面包 含 一 个 表达 式 ， 表 达 式 后 面 跟着 一 个 for 语 句 ， 后 面 还 
可 以 接 需 个 或 更 多 的 for 或 if 语句 。 结 果 是 一 个 新 的 列表 ， 由 表达 式 依据 其 后 面 的 for 和 if 子 句 上 
下 文 计 算 而 来 的 结果 构成 。 例 如 ， 下 面 的 listcomp 组 合 两 个 列表 中 不 相等 的 元 素 : 


>>> [(x, y) for x in [1,2,3] for y in [3,1,4] if x != y] 
[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)] 


它 等 效 于 : 


>>> combs = [] 
>>> for x in [1,2,3]: 
for y in [3,1,4]: 
if x != y: 
combs.append((x, y)) 


>>> combs 
[ (1, 3), (1, 4), (2, 3), (2, ai, (2, 4), (3, 19) (3, 4)] 
注意 在 两 个 代码 段 中 for 和 if 语句 的 顺序 是 相同 的 。 


如 果 表 达 式 是 一 个 元 组 (例如 前 面 示 例 中 的 x, y) ， 它 必须 带 圆 括号 。 


>>> vec = [-4, -2, 0, 2, 4] 
>>> # create a new list with the values doubled 
>>> [x*2 for x in vec] 
[-8, -4, 0, 4, 8] 
>>> H filter the list to exclude negative numbers 
>>> [x for x in vec if x >= 0] 
[0, 2, 4] 
>>> # apply a function to all the elements 
>>> [abs(x) for x in vec] 
[4, 2, 0, 2, 4] 
>>> # call a method on each element 
>>> freshfruit = [' banana', ' loganberry ', 'passion fruit '] 
>>> [weapon.strip() for weapon in freshfruit] 
['banana', 'loganberry', 'passion fruit'] 
>>> # create a list of 2-tuples like (number, square) 
>>> [(x, x**2) for x in range(6)] 
[(0, ©), (1, 1), (2, 4), (3, 9), (4, 16), (5, 25)] 
>>> # the tuple must be parenthesized, otherwise an error is raised 
>>> [x, x**2 for x in range(6)] 
File "«stdin»", line 1 
[x, x**2 for x in range(6)] 
^ 

SyntaxError: invalid syntax 
>>> # flatten a list using a listcomp with two 'for' 
>>> vec = [[1,2,3], [4,5,6], [7,8,9]] 
>>> [num for elem in vec for num in elem] 
E 2,83, -4, a O 7/587 279] 


REPARATUR AHALAMREN A : 


>>> from math import pi 

>>> [str(round(pi, i)) for i in range(1, 6)] 

[Eel OT A Wea em AT Owes 143/590] 

5.1.4.1. 谋 套 的 列表 推导 式 

列表 推导 式 中 的 第 一 个 表达 式 可 以 是 任何 表达 式 ， 包 括 另 外 一 个 列表 推导 式 。 


考虑 下 面 由 三 个 长 度 为 4 的 列表 组 成 的 3x4 矩阵 : 


>>> matrix = [ 
[17227 354] 
Sy Ge Wy Sih 
E92 allo) alas 2 


下 面 的 列表 推导 式 将 转 置 行 和 列 : 


>>> [[row[i] for row in matrix] for i in range(4)] 
bts y Slip |e Be Bolle lise % abl, 4 te 221) 


正如 我 们 在 上 一 节 中 看 到 的 ， 岩 套 的 listcomp 在 跟随 它 之 后 的 for 字句 中 计算 ， 所 以 此 例 等 同 
T: 


>>> transposed = [] 
>>> for i in range(4): 
transposed.append([row[i] for row in matrix]) 


>>> transposed 
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]] 


以 此 下 去 ， 还 等 同 于 : 


>>> transposed = [] 
>>> for i in range(4): 
# the following 3 lines implement the nested listcomp 
transposed_row = [] 
for row in matrix: 
transposed row.append(row[i]) 
transposed.append(transposed row) 


>>> transposed 
[B [EE "REO e Ge ESTO e Wp Baby, 4, &, 22 


在 实际 中 ， 和 与 复杂 的 控制 流 比 起 来 ， 你 应 该 更 喜欢 内 置 的 函数 。 针 对 这 种 场景 ， 使 用 zip() E 
数 会 更 好 : 


>>> zip(*matrix) 
[(1, 5, 9), (2, 6, 10), (3, 7, 11), (4, 8, 12)] 


关于 本 行 中 使 用 的 星 号 的 说 明 ， 请 参阅 参数 列表 的 分 拆 。 


5.2. del 语 名 


有 个 方法 可 以 从 列表 中 根据 索引 而 不 是 值 来 删除 一 个 元 素 : del 语 句 。 这 不 同 于 有 返回 值 的 
pop() 方 法 。del 语 句 还 可 以 用 于 从 列表 中 删除 切片 或 清除 整个 列表 (之 前 我 们 是 将 空 列表 赋值 
给 切片 ) 。 例 如 : 


>>> a = [-1, 1, 66.25, 333, 333, 1234.5] 
>>> del a[0] 

>>> a 

[1, 66.25, 333, 333, 1234.5] 

>>> del a[2:4] 

>>> a 

[1, 66.25, 1234.5] 

>>> del a[:] 

>>> a 


del 也 可 以 用 于 删除 整个 变量 : 


>>> del a 
此 后 再 引用 名 称 a 将 会 报错 〈 直 到 有 另 一 个 值 被 赋 给 它 ) 。 稍 后 我 们 将 看 到 del 的 其 它 用 途 。 


5.3. 元 组 和 序列 


我 们 已 经 看 到 列表 和 字符 串 具有 很 多 共同 的 属性 ， 如 索引 和 切片 操作 。 它 们 是 序列 数据 类 型 
的 两 个 例子 (参见 序列 类 型 一 str, unicode, list, tuple, bytearray, buffer, xrange)。 因 为 
Python 是 一 个 正在 不 断 进 化 的 语言 ， 其 他 的 序列 类 型 也 可 能 被 添加 进来 。 还 有 另 一 种 标准 序 
列 数据 类 型 : 元 组 。 


元 组 由 吾 号 分 割 的 若干 值 组 成 ， 例 如 : 


>>> t = 12345, 54321, 'hello!' 
>>> t[0] 

12345 

>>> t 

(12345, 54321, 'hello!') 

>>> # Tuples may be nested: 

E (108278 3 2, & 
>>> u 
((12345, 54321, 'hello!'), (1, 2, 3, 4, 5)) 
>>> # Tuples are immutable: 

. t[0] = 88888 
Traceback (most recent call last): 

File "«stdin»", line 1, in «module» 
TypeError: 'tuple' object does not support item assignment 
>>> # but they can contain mutable objects: 

"EVI Cal, 2, slp lis 2, al) 
>>> V 
(I1, 2, 3], [3, 2, 1]) 


DORA IL, TOA REAR SH, LET EPARREAY ; 在 输入 时 可 以 有 也 可 以 
没有 括号 ， 不 过 括号 经 常 都 是 必须 的 〈 如 果 元 组 是 一 个 更 大 的 表达 式 的 一 部 分 ) 。 不 能 给 元 
组 中 单独 的 一 个 元 素 赋 值 ， 不 过 可 以 创建 包含 可 变 对 象 (例如 列表 ) 的 元 组 。 


虽然 元 组 看 起 来 类 似 于 列表 ， 它 们 经 常用 于 不 同 的 场景 和 不 同 的 目的 。 元 组 是 不 可 变 的 ， 通 
常 包含 不 同 种 类 的 元 素 并 通过 分 拆 (参阅 本 节 后 面 的 内 容 ) 或 索引 访问 GOR 

是 namedtuples， 甚 至 可 以 通过 属性 ) 。 列 表 是 可 变 的 ， 它 们 的 元 素 通常 是 相同 的 类 型 并 通过 
迭代 访问 。 

一 个 特殊 的 情况 是 构造 包含 0 个 或 1 个 元 素 的 元 组 : 为 了 实现 这 种 情况 ， 语 法 上 有 一 些 奇 怪 。 

空 元 组 由 一 对 空 插 号 创建 ; 只 有 一 个 元 素 的 元 组 由 值 后 面 跟随 一 个 逗号 创建 (在 括号 中 放 入 单 
独 一 个 值 还 不 够 ) . HB, (FEAR. AAN : 


>>> empty = () 

>>> singleton = 'hello', # <-- note trailing comma 
>>> len(empty) 

>>> len(singleton) 

>>> singleton 


('hello',) 


语句 t=12345,54321,'hello! 是 一 个 元 组 封装 的 例子 : 1412345,54321 和 'hello! 被 一 起 放 入 一 
个 元 组 。 其 逆 操 作 也 是 可 以 的 : 


>>> X, y, Z=t 


这 被 称 为 序列 分 拆 再 恰当 不 过 了 ， 且 可 以 用 于 右边 的 任何 序列 。 序 列 分 拆 要 求 左 侧 变量 的 数 
目 和 序列 中 元 素 的 数目 相同 。 注 意 多 重 赋值 只 是 同时 进行 元 组 封装 和 序列 分 拆 。 


5.4. 集合 


Python 还 包含 一 个 数据 类 型 用 于 集合 。 集 合 中 的 元 素 没 有 顺序 且 不 会 重复 。 集 合 的 基本 用 途 
有 成 员 测试 和 消除 重复 的 条 目 。 集 合 对 象 还 支持 并 集 、 交 集 、 差 和 对 称 差 等 数学 运算 。 


花 括号 或 set() 画 数 可 以 用 于 创建 集合 。 注 意 : 若 要 创建 一 个 空 的 集合 你 必须 使 用 set()， 不 能 
用 人 } ; 后 者 将 创建 一 个 空 的 字典 ， 一 个 我 们 在 下 一 节 中 要 讨论 的 数据 结构 。 


这 里 是 一 个 简短 的 演示 : 


>>> basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana' ] 
>>> fruit = set(basket) # create a set without duplicates 
>>> fruit 

set(['orange', 'pear', 'apple', 'banana']) 

>>> 'orange' in fruit # fast membership testing 

True 

>>> 'crabgrass' in fruit 

False 


>>> # Demonstrate set operations on unique letters from two words 


>>> a = set('abracadabra') 
>>> b = set('alacazam') 


>>> a # unique letters ina 

Seed Ma, Viet, Yet, Mer, Fel!) 

>>> a- b # letters in a but not in b 
Sei E EUCH MES DUNT 

>>> a | b # letters in either a or b 

Sere Malt. Yer, Met Voll, Mo's MIM, Ure) Vale |) 

>>> a&b # letters in both a and b 
set(['a', 'c']) 

>>> a 人 b # letters in a or b but not both 


set(['r', 'd', yb Sms Uu 2o 


和 列表 推导 式 类 似 ， 集 合 也 支持 推导 式 : 


>>> a = {x for x in 'abracadabra' if x not in 'abc') 
>>> a 
scires. dep 


5.5. FH 


Python 内 建 的 另 一 种 有 用 的 数据 类 型 是 字典 〈 见 映射 类 型 一 字典 )。 在 其 它 语言 中 字典 有 时 
被 称 为 “associative memories” 或 者 “associative arrays"”。 与 序列 不 同 ， 序 列 由 数字 做 索引 ， 
字典 由 key 做 索引 ，key 可 以 是 任意 不 可 变 类 型 ; 字符 串 和 数字 永远 可 以 拿 来 做 key。 如 果 元 
组 只 包含 字符 串 、 数字 或 元 组 ， 此 元 组 可 以 用 作 key ; 如 果 元 组 直接 或 间接 地 包含 任何 可 变 对 
象 ， 那 么 它 不 能 用 作 键 。 不 能 用 列表 作为 键 ， 因 为 列表 可 以 用 索引 、 切 片 或 者 append() 和 
extend() 方 法 原 地 修改 。 


理解 字典 的 最 佳 方式 是 把 它 看 做 无 序 的 键 : 值 对 集合 ， 要 求 是 键 必须 是 唯一 的 〈 在 同一 个 字典 
A) 。 一 对 花 括号 将 创建 一 个 空 的 字典 : 们 。 花 括号 中 由 去 号 分 隔 的 键 : 值 对 将 成 为 字典 的 初 
始 值 ; 打印 字典 时 也 是 按照 这 种 方式 输出 。 


字典 的 主要 操作 是 依据 键 来 存 取 值 。 也 可 以 通过 del 删 除 键 : 值 对 。 如 果 用 一 个 已 经 存在 的 键 存 
储 值 ， 以 前 为 该 关键 字 分 配 的 值 就 会 被 遗忘 。 用 一 个 不 存在 的 键 读 取 值 会 导致 错误 。 


字典 对 象 的 keys() 方 法 返回 字典 中 所 有 键 组 成 的 列表 ， 列 表 的 顺序 是 随机 的 (如 果 你 想 要 排 
序 ， 只 需 在 它 上 面 调 用 sorted() 函 数 ) 。 要 检查 某 个 键 是 否 在 字典 中 ， 可 以 使 用 in 关键 字 。 


下 面 是 一 个 使 用 字典 的 小 示例 : 


>>> tel = {'jack': 4098, 'sape': 4139} 

>>> tel['guido'] = 4127 

>>> tel 

{'sape': 4139, 'guido': 4127, 'jack': 4098} 
>>> tel['jack'] 

4098 

>>> del tel['sape'] 

>>> tel['irv'] = 4127 

>>> tel 

{'guido': 4127, 'irv': 4127, 'jack': 4098} 
>>> tel.keys() 

['guido', 'irv', 'jack'] 

>>> 'guido' in tel 

True 


dict() A ERA IE E M b - 18 5 Fe 91 OE: 


>>> dict([('sape', 4139), ('guido', 4127), ('jack', 4098)]) 
{'sape': 4139, 'jack': 4098, 'guido': 4127} 


此 外 ， 字 典 推导 式 式 可 以 用 于 从 任意 键 和 值 表达 式 创 建 字典 : 


>>> (x: x**2 for x in (2, 4, 6)} 
(2: 4, 4: 16, 6: 36) 


如 果 键 都 是 简单 的 字符 串 ， 有 时 通过 关键 字 参 数 指定 键 - 值 对 更 为 方便 : 


>>> dict(sape=4139, guido=4127, jack=4098) 
{'sape': 4139, 'jack': 4098, 'guido': 4127} 


5.6. m 5 B]13 15 
38/5 — T oat, fiFHenumerate() PRX RT LA eT 4: 1 S 8 Al E AV. 


>>> for i, v in enumerate(['tic', 'tac', 'toe']): 
print i, v 

9 tic 

1 tac 

2 toe 


[la i PSS TRU], (EFA Zip() BSBA) LARK xt RTR. 


>>> questions = ['name', 'quest', 'favorite color'] 
>>> answers = ['lancelot', 'the holy grail', 'blue'] 
>>> for q, a in zip(questions, answers): 
print 'What is your {0}? It is {1}.'.format(q, a) 


What is your name? It is lancelot. 


What is your quest? It is the holy grail. 
What is your favorite color? It is blue. 


要 反 向 通 历 一 个 序列 ， 首 先 正 向 生成 这 个 序列 ， 然 后 调用 reversed() HR. 


>>> for i in reversed(xrange(1,10,2)): 
print i 


e UANO. 


(E54 —T Fe URE IAP, AE MAsorted H, iRIBI AAAF BUR, let RRA 


>>> basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana'] 
>>> for f in sorted(set(basket)): 
print f 
apple 
banana 


orange 
pear 


通 历 字典 时 ， 使 用 iteritems() 方 法 可 以 同时 得 到 键 和 对 应 的 值 。 


>>> knights = {'gallahad': 'the pure', 'robin': 'the brave'} 
>>> for k, v in knights.iteritems(): 
print k, v 


gallahad the pure 
robin the brave 


Sta FA RMECUIE He HAAS 〈 例 如 复制 某 些 元 素 ) ， 建 议 您 首先 制作 副本 。 在 序列 
上 循环 不 会 隐 式 地 创建 副本 。 切 片 表示 法 使 这 尤其 方便 : 


>>> words = ['cat', 'window', 'defenestrate'] 
>>> for w in words[:]: # Loop over a slice copy of the entire list. 
if len(w) > 6: 
words.insert(0, w) 


>>> words 


['defenestrate', 'cat', 'window', 'defenestrate'] 


5.7. 深入 条 件 控制 
while 和 if 语句 中 使 用 的 条 件 可 以 包含 任意 的 操作 ， 而 不 仅仅 是 比较 。 


比较 操作 符 in 和 notin 检查 一 个 值 是 否 在 一 个 序列 中 出 现 ( 不 出现 ) 。is 和 isnot 运算 符 比较 
两 个 对 象 是 否 为 相同 的 对 象 ; 这 只 和 列表 这 样 的 可 变 对 象 有 关 。 所 有 比较 运算 符 都 具有 相同 
的 优先 级 ， 低 于 所 有 数值 运算 符 。 


比较 可 以 级 联 。 例 如 ，a<b==c 测 试 a 是 否 小 于 b 并 且 b 是 否 等 于 c。 


可 以 使 用 布尔 运算 符 and 和 or 组 合 ， 上 比较 的 结果 (或 任何 其 他 的 布尔 表达 式 ) 可 以 用 not Bx 
反 。 这 些 操作 符 的 优先 级 又 低 于 比较 操作 符 ; 它们 之 间 ，not 优先 级 最 高 ，or 优先 级 最 低 ， 所 
以 AandnotBorC 等 效 于 (Aand(notB))orC。 与 往常 一 样 ， 可 以 使 用 括号 来 表示 所 需 的 组 合 。 


布尔 运算 符 and 和 or 是 所 谓 的 短路 运算 符 : 依 参数 从 左 向 右 求 值 ， 结 果 一 旦 确定 就 停止。 
例如 ， 如 果 A 和 C 都 为 真 ， 但 B 是 假 ， AandBandC 将 不 计算 表达 式 C。 用 作 一 个 普通 值 而 非 
逻辑 值 时 ， 短 路 操作 符 的 返回 值 通常 是 最 后 一 个 计算 的 。 


可 以 把 比较 或 其 它 逻 辑 表达 式 的 返回 值 赋 给 一 个 变量 。 例 如 ， 


>>> string1, string2, string3 = '', 'Trondheim', 'Hammer Dance' 
>>> non null = stringi or string2 or string3 
>>> non null 


'Trondheim' 


注意 在 Python 中 ， 与 C 不 同 ， 表 达 式 的 内 部 不 能 出 现 赋值 。C 程 序 员 可 能 会 抱怨 这 一 点 ， 但 它 
避免 了 C 程 序 中 常见 的 一 类 问题 : 在 表达 式 中 输入 = 而 真正 的 意图 是 ==。 


5.8. 序列 和 其 它 类 型 的 比较 


序列 对 象 可 以 与 具有 相同 序列 类 型 的 其 他 对 象 相 比较 。 比 较 按照 字典 序 进行 : 首先 比较 两 个 
序列 的 首 元 素 ， 如 果 不 同 ， 就 决定 了 比较 的 结果 ; 如 果 相同 ， 就 比较 后 面 两 个 元 素 ， 依 此 类 

推 ， 直 到 其 中 一 个 序列 穷 举 完 。 如 果 要 比较 的 两 个 元 素 本 身 就 是 同一 类 型 的 序列 ， 就 按 字 典 

序 递 归 比 较 。 如 果 两 个 序列 的 所 有 元 素 都 相等 ， 就 为 序 认 列 相等 。 如 果 一 个 序列 是 另 一 个 序 

列 的 初始 子 序列 ， 较 短 的 序列 就 小 于 另 一 个 。 字 符 串 的 字典 序 按照 单字 符 的 ASCI 顺序 。 下 

面 是 同类 型 序列 之 间 比 较 的 一 些 例 子 : 


(G22) < 
fab a Si < 
'ABC' < 'C' « 'Pascal' « 
(Gly EG EA) « 
(1, 2) < 


(1, 2, 3) am 


(iy 2) <4) 

[1, 2, 4] 
'Python' 
(1，2，4) 

(1, 2, -1) 
(1.0, 2.0, 3.0 


6. 模块 


如 果 你 退出 Python 解释 器 并 重新 进入 ， 你 做 的 任何 定义 (变量 和 方法 ) 都 会 丢失 。 因 此 ， 如 
果 你 想 要 编写 一 些 更 大 的 程序 ， 最 好 使 用 文本 编辑 器 先 编写 好 ， 然 后 运行 这 个 文件 。 这 就 是 
所 谓 的 创建 脚本 。 随 着 你 的 程序 变 得 越 来 越 长 ， 你 可 能 想 要 将 它 分 成 几 个 文件 ， 这 样 更 易于 
维护 。 你 还 可 能 想 在 几 个 程序 中 使 用 你 已 经 编写 好 的 函数 ， 而 不 用 把 酌 数 丘 贝 到 每 个 程序 
中 。 


为 了 支持 这 个 功能 ，Python 有 种 方法 可 以 把 你 定义 的 内 容 放 到 一 个 文件 中 ， 然 后 在 脚本 或 者 
交互 方式 中 使 用 。 这 种 文件 称 为 模块 ; 模块 中 的 定义 可 以 导入 到 其 它 模块 或 主 模块 中 。 


模块 是 包含 Python 定义 和 声明 的 文件 。 文 件 名 就 是 模块 名 加 上 .py 后 级 。 在 模块 里 面 ， 模 块 
的 名 字 (是 一 个 字符 串 ) 可 以 由 全 局 变量 name 的 值得 到 。 例 如 ， 用 你 喜欢 的 文本 编辑 器 在 
当前 目录 下 创建 一 个 名 为 fibo.py 的 文件 ， 内 容 如 下 : 


# Fibonacci numbers module 


def fib(n): # write Fibonacci series up to n 
a, b-0,41 
while b « n: 
print b, 
a, b = b, a+b 


def fib2(n): # return Fibonacci series up to n 
result - [] 
a, b=0, 1 
while b « n: 
result.append(b) 
a, b = b, a+b 
return result 


现在 进入 Python 解释 器 并 使 用 下 面 的 命令 导入 这 个 模块 : 


>>> Import fibo 


这 不 会 直接 把 fibo 中 定义 的 函数 的 名 字 导 入 当前 的 符号 表 中 ; 它 只 会 把 模块 名 字 fibo 导入 其 
中 。 你 可 以 通过 模块 名 访问 这 些 范 数 : 


>>> fibo.fib(1000) 

11235 8 13 21 34 55 89 144 233 377 610 987 
>>> fibo.fib2(100) 

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89] 

>>> fibo. name . 

' fibo' 


AD RAIRHET S98 RR FH — NS, T EURE'IE RA TAMN SS : 


»»» fib - fibo.fib 
>>> fib(500) 
11235 8 13 21 34 55 89 144 233 377 


6.1. 深入 模块 
模块 可 以 包含 可 执行 语句 以 及 酌 数 的 定义 。 这 些 语句 通常 用 于 初始 化 模块 。 它 们 只 在 第 一 次 
导入 时 执行 。[1] (如 果 文 件 以 脚本 的 方式 执行 ， 它 们 也 会 运行 。) 


每 个 模块 都 有 自己 的 私有 符号 表 ， 模 块 内 定义 的 所 有 画 数 用 其 作为 全 局 符号 表 。 因 此 ， 模 块 
的 作者 可 以 在 模块 里 使 用 全 局 变量 ， 而 不 用 担心 与 某 个 用 户 的 全 局 变量 有 冲突 。 另 一 方面 ， 
如 果 你 知道 自己 在 做 什么 ， 你 可 以 使 用 引用 模块 画 数 的 表示 法 访问 模块 的 全 局 变量 ， 


modname.itemname。 


模块 中 可 以 导入 其 它 模块 。 习 惯 上 将 所 有 的 import 语句 放 在 模块 (或 者 脚本 ) 的 开始 ， 但 这 
不 是 强制 性 的 。 被 导入 的 模块 的 名 字 放 在 导入 模块 的 全 局 符号 表 中 。 


import 语句 的 一 个 变 体 直 接 从 被 导入 的 模块 中 导 人 名 字 到 导入 模块 的 符号 表 中 。 例 如 : 


>>> from fibo import fib, fib2 
>>> fib(500) 
1125358 13 21 34 55 89 144 233 377 


这 不 会 把 模块 名 导 和 人 到 本 地 的 符号 表 中 〈 所 以 在 本 例 中 ，fibo 将 没有 定义 ) 。 
还 有 种 方式 可 以 导入 模块 中 定义 的 所 有 名 字 : 


>>> from fibo import * 
>>> fib(500) 
1125358 13 21 34 55 89 144 233 377 


这 种 方式 不 会 导 和 人 以 下 划 线 (_) 开头 的 名 称 。 


注意 一 般 情 况 下 不 痪 成 从 一 个 模块 或 包 中 导入 * ， 因 为 这 通常 会 导致 代码 很 难 读 。 不 过 ， 在 
交互 式 会 话 中 这 样 用 是 可 以 的 ， 它 可 以 让 你 少 敲 一 些 代码 。 

注意 

出 于 性 能 考虑 ， 每 个 模块 在 每 个 解释 器 会 话 中 只 导入 一 通 。 因 此 ， 如 果 你 修改 了 你 的 模块 ， 


你 必需 重新 启动 解释 器 或 者 ， 如 果 你 就 是 想 交 互 式 的 测试 这 么 一 个 模块 ， 可 以 使 
用 reload()， 例 如 reload(modulename)。 





6.1.1. 执行 模块 
当 你 用 下 面 的 方式 运行 一 个 Python 模块 


python fibo.py <arguments> 


模块 中 的 代码 将 会 被 执行 ， 就 像 导入 它 一 样 ， 不 过 此 时 name 被 设置 为 "main" 。 也 就 是 说 ， 
如 果 你 在 模块 后 加 入 如 下 代码 : 


if name == " main " 





import sys 
fib(int(sys.argv[1])) 


就 可 以 让 此 文件 既 可 以 作为 可 执行 的 脚本 ， 也 可 以 当 作 可 以 导入 的 模块 ， 因 为 解析 命令 行 的 
那 部 分 代码 只 有 在 模块 作为 “main" 文件 执行 时 才 被 调用 : 


$ python fibo.py 50 
11235 8 13 21 34 


如 果 模 块 是 被 导入 的 ， 将 不 会 运行 这 段 代 码 : 


>>> import fibo 
>>> 


这 种 方法 通常 用 来 为 模块 提供 一 个 方便 的 用 户 接 口 ， 或 者 用 来 测试 (例如 直接 运行 脚本 会 执 
行 一 组 测试 用 例 ) 。 


6.1.2. 模块 搜索 路 径 


当 导 入 一 个 名 为 spam 的 模块 时 ， 解 释 器 首先 搜索 具有 该 名 称 的 内 置 模块 。 如 果 没有 找到 
它 会 接着 到 sys.path 变量 给 出 的 目录 中 查找 名 为 spam.py 的 文件 。sys.path 变量 的 初始 值 来 
自 这 些 位 置 : 


e 脚本 所 在 的 目录 (或 当前 目录 ) 。 
e PYTHONPATH (一 个 包含 目录 名 的 列表 ， 与 shell 变量 PATH 的 语法 相同 ) 。 
e. 与 安装 相关 的 默认 值 。 


初始 化 后 ，Python 程序 可 以 修改 sys.path。 脚 本 所 在 的 目录 被 放置 在 搜索 路 径 的 最 开始 ， 也 
就 是 在 标准 库 的 路 径 之 前 。 这 意味 着 将 会 加 载 当 前 目录 中 的 脚本 ， 库 目录 中 具有 相同 名 称 的 
模块 不 会 被 加 载 。 除 非 你 是 有 意 想 蔡 换 标准 库 ， 否 则 这 应 该 被 当成 是 一 个 错误 。 更 多 信息 请 
参阅 标准 模块 小 节 。 


6.1.3. "编译 过 的 " Python 文件 


对 于 使 用 了 大 量 标准 模块 的 简短 程序 ， 有 一 个 提高 启动 速度 的 重要 方法 ， 如 果 在 spam.py 所 在 
的 目录 下 存在 一 个 名 为 spam.pyc 的 文件 ， 它 会 被 视 为 spam 模 块 的 已 “编译 ?版 本 。 生 成 
spam.pyc 文 件 时 ，spam.py 文 件 的 修改 时 间 会 被 记录 在 spam.pyc 文 件 中 ， 如 果 时 间 不 匹 

配 ，.pyc 文 件 将 被 忽略 。 


通常 情况 下 ， 您 不 需要 做 任何 事情 来 创建 spam.pyc 文 件 。 每 当 spam.py 编 译 成 功 ， 会 党 试 向 
spam.pyc 写 入 编译 的 版 本 。 尝 试 失败 也 不 会 出 现 错误 ; 如 果 出 于 任何 原因 文件 写 入 不 完全 ， 
生成 的 spam.pyc 文件 将 被 当 作 是 无 效 的 ， 并 且 在 以 后 会 被 忽略 。spam.pyc 文 件 的 内 容 与 平 
台 无 关 ， 因 此 Python 模块 的 目录 可 以 在 不 同体 系 结构 的 机 器 间 共 享 。 


部 分 高 级 技巧 : 


。 当 以 -O 标 志 调 用 Python 解释 器 时 ， 将 生成 优化 的 代码 并 保存 在 .pyo 文 件 中 。 目 前 的 优化 
不 会 帮助 太 多 ; 它 只 是 删除 assert 语 句 。 当 使 用 -O 时 ， 将 优化 所 有 的 字 节 码 ; 将 忽略 .pyc 
文件 并 将 .py 文件 编译 成 优化 的 字 节 码 。 

。 向 Python 解释 器 传递 两 个 -O 标 志 (COO) 会 导致 字 节 码 编译 器 执行 优化 ， 极 少数 情况 
下 ， 这 可 能 导致 程序 故障 。 目 前 只 会 从 字 节 码 中 删除 doc 字 符 串 ， 使 .pyo 文 件 更 加 紧凑 。 
因为 某 些 程序 可 能 会 依赖 于 具有 这 些 可 用 ， 您 点 只 使 用 此 选项 ， 在 你 知道 你 在 做 什么 
时 。 

。 程序 不 能 运行 得 更 快 ， 不 管 它 是 从 哪 种 文件 〈.py ; .pyc 或 .pyo) 中 读 取 。 唯 一 加 速 的 
是 .pyc 或 .pyo 文 件 的 加 载 速度 。 

e 当 在 命令 行使 用 脚本 名 称 来 运行 脚本 时 ， 脚 本 的 字 节 码 是 不 会 被 写 入 相应 的 .pyc 或 .pyo 文 
件 中 的 。 因 此 ， 如 果 将 大 部 分 与 启动 无 关 的 代码 移 到 一 个 模块 中 而 以 导入 模块 的 方式 在 
启动 脚本 中 导入 这 个 模块 就 可 节省 一 些 启 动 时 间 。 人 也 可 以 直接 在 命令 行 上 运行 .pyc 或 .pyo 
文件 。 

。 可 以 没有 相同 的 模块 文件 spam.py 时 ， 使 用 文件 spam.pyc (或 spam.pyo 时 使 用 -O ) 。 
这 可 用 于 发 布 不 太 容 易 进 行 反 向 工程 的 Python 代码 库 。 

e 模块 compileall 可 以 为 一 个 目录 中 的 所 有 模块 创建 .pyc 文 件 (或 .pyo 文 件 时 使 用 -O ) 。 


6.2. 标准 模块 


Python 带 有 一 个 标准 模块 库 ， 并 发 布 有 单独 的 文档 叫 Python 库 参 考 手 册 (以 下 简称 " 库 参 考 
手册 ") 。 有 些 模 块 被 直接 构建 在 解析 器 里 ; 这 些 操作 虽然 不 是 语言 核心 的 部 分 ， 但 是 依然 被 
内 建 进来 ， 一 方面 是 效率 的 原因 ， 另 一 方面 是 为 了 提供 访问 操作 系统 原 语 如 系统 调用 的 功 
能 。 这 些 模块 是 可 配置 的 ， 也 取决 于 底层 的 平台 。 例 如 ，winreg 模 块 只 在 Windows 系 统 上 提 
供 。 有 一 个 特别 的 模块 值得 注意 : sys， 它 内 置 在 每 一 个 Python 解 析 器 中 。 亦 量 sys.ps1 和 
sys.ps2 定 义 了 主 提示 符 和 辅助 提示 符 使 用 的 字符 串 : 


>>> import sys 
>>> Sys.psi 
E» 


>>> sys.ps2 


>>> sys.psi = 'C> ' 
C> print 'Yuck!' 
Yuck! 

c> 


只 有 在 交互 式 模 式 中 ， 这 两 个 变量 地 有 定义 。 


变量 sys.path 是 一 个 字符 串 列表 ， 它 决定 了 解释 器 搜索 模块 的 路 径 。 它 初始 的 默认 路 径 来 自 
于 环境 变量 PYTHONPATH， 如 果 PYTHONPATH 未 设置 则 来 自 于 内 置 的 默认 值 。 你 可 以 使 
用 标准 的 列表 操作 修改 它 : 


>>> import sys 
>>> sys.path.append( '/ufs/guido/lib/python') 


6.3. dir) HŽ% 
AEKA dir() 用 来 找 出 模块 中 定义 了 哪些 名 字 。 它 返回 一 个 排 好 序 的 字符 串 列 表 : 


>>> import fibo, sys 

>>> dir(fibo) 

['__name__', ‘fib', 'fib2'] 

>>> dir(sys) 

[' displayhook ', ' doc ', '__excepthook__', ' name ', '__package__', 








' stderr ', ' stdin ', ' stdout ', ' clear type cache', 








' current frames', ' getframe', ' mercurial', 'api version', 'argv', 
'builtin module names', 'byteorder', 'call tracing', 'callstats', 
'copyright', 'displayhook', 'dont write bytecode', 'exc clear', 'exc info', 
'exc traceback', 'exc type', 'exc value', 'excepthook', 'exec prefix', 
'executable', 'exit', 'flags', 'float info', 'float repr style', 
'getcheckinterval', 'getdefaultencoding', 'getdlopenflags', 
'getfilesystemencoding', 'getobjects', 'getprofile', 'getrecursionlimit', 
'getrefcount', 'getsizeof', 'gettotalrefcount', 'gettrace', 'hexversion', 
'long info', 'maxint', 'maxsize', 'maxunicode', 'meta path', 'modules', 
'path', 'path hooks', 'path importer cache', 'platform', 'prefix', 'ps1', 
'py3kwarning', 'setcheckinterval', 'setdlopenflags', 'setprofile', 
'setrecursionlimit', 'settrace', 'stderr', 'stdin', 'stdout', 'subversion', 
'version', 'version info', 'warnoptions'] 


如 果 不 带 参数 ， dir() 列 出 当前 已 定义 的 名 称 : 


so f= (al, 2, y 4, Bl 

>>> import fibo 

>>> fib = fibo.fib 

>>> dir() 

[' builtins ', ' name ', ' package ', 'a', 'fib', 'fibo', 'sys'] 





注意 它 列 出 了 所 有 类 型 的 名 称 : 变量 、 模块 、 WAS. 


dir() 不 会 列 出 内 置 的 函数 和 变量 的 名 称 。 如 果 你 想 列 出 这 些 内 容 ， 它 们 定义 在 标准 模块 
builtin 中 : 


>>> import — builtin . 

>>> dir(  builtin 9) 

['ArithmeticError', 'AssertionError', 'AttributeError', 'BaseException', 
'BufferError', 'BytesWarning', 'DeprecationWarning', 'EOFError', 
'Ellipsis', 'EnvironmentError', 'Exception', 'False', 'FloatingPointError', 
'FutureWwarning', 'GeneratorExit', 'IOError', 'ImportError', 'ImportWarning', 
'IndentationError', 'IndexError', 'KeyError', 'KeyboardInterrupt', 
'LookupError', 'MemoryError', 'NameError', 'None', 'NotImplemented', 
'NotImplementedError', 'OSError', 'OverflowError', 
'PendingDeprecationWarning', 'ReferenceError', 'RuntimeError', 
'RuntimeWarning', 'StandardError', 'StopIteration', 'SyntaxError', 
'SyntaxWarning', 'SystemError', 'SystemExit', 'TabError', 'True', 
'TypeError', 'UnboundLocalError', 'UnicodeDecodeError', 
'UnicodeEncodeError', 'UnicodeError', 'UnicodeTranslateError', 
'UnicodeWarning', 'UserWarning', 'ValueError', 'Warning', 
'ZeroDivisionError', ' ', ' debug ', ' doc ', ' import ', 





' name ', ' package ', 'abs', 'all', 'any', 'apply', 'basestring', 





'bin', 'bool', 'buffer', 'bytearray', 'bytes', 'callable', 'chr', 
'classmethod', 'cmp', 'coerce', 'compile', 'complex', 'copyright', 
'credits', 'delattr', 'dict', 'dir', 'divmod', 'enumerate', 'eval', 
'execfile', 'exit', 'file', 'filter', 'float', 'format', 'frozenset', 
'getattr', 'globals', 'hasattr', 'hash', 'help', 'hex', 'id', 'input', 
'int', 'intern', 'isinstance', 'issubclass', 'iter', 'len', 'license', 
'list', 'locals', 'long', 'map', 'max', 'memoryview', 'min', 'next', 
'object', 'oct', 'open', 'ord', 'pow', 'print', 'property', 'quit', 
'range', 'raw input', 'reduce', 'reload', 'repr', 'reversed', 'round', 
'set', 'setattr', 'slice', 'sorted', 'staticmethod', 'str', 'sum', 'super', 
'tuple', 'type', 'unichr', 'unicode', 'vars', 'xrange', 'zip'] 


6.4. a 


包 是 一 种 管理 Python 模块 命名 空间 的 方式 ， 采 用 "点 分 模块 名 称 "。 例 如 ， 模 块 名 A.B 表示 包 
人 A 中 一 个 名 为 B 的 子 模块 。 就 像 模 块 的 使 用 让 不 同 模 块 的 作者 不 用 担心 相互 间 的 全 局 变量 名 
称 一 样 ， 点 分 模块 的 使 用 让 包含 多 个 模块 的 包 (例如 Numpy 和 Python Imaging Library) 的 
作者 也 不 用 担心 相互 之 间 的 模块 重 名 。 


假设 你 想 要 设计 一 系列 模块 〈 或 一 个 " 包 ”) 来 统一 处 理 声 音 文件 和 声音 数据 。 现 存 很 多 种 不 同 
的 声音 文件 格式 (通常 由 它们 的 扩展 名 来 识别 ， 例 如 : .wav, .aiff, .au) ， 因 此 你 可 能 需要 创 
建 和 维护 不 断 增 长 的 模块 集合 来 支持 各 种 文件 格式 之 间 的 转换 。 你 可 能 还 想 针 对 音频 数据 做 
很 多 不 同 的 操作 (上 比如 混 音 ， 添 加 回声 ， 增 加 均衡 器 功能 ， 创 建 人 造 立 体 声 效果 ) ， 所 以 你 
还 需要 编写 一 组 永远 写 不 完 的 模块 来 处 理 这 些 操作 。 你 的 包 可 能 会 是 这 个 结构 (用 分 层 的 文 
件 系统 表示 ) 


sound/ Top-level package 
__init__.py Initialize the sound package 
formats/ Subpackage for file format conversions 
__init__.py 


wavread.py 
wavwrite.py 
aiffread.py 
aiffwrite.py 
auread.py 
auwrite.py 


effects/ Subpackage for sound effects 
__init__.py 
echo. py 
surround. py 
reverse. py 


filters/ Subpackage for filters 
__ init__.py 
equalizer .py 


vocoder . py 
karaoke. py 


导入 这 个 包 时 ，Python 搜索 sys.path 中 的 目录 以 寻找 这 个 包 的 子 目录 。 


为 了 让 Python 将 目录 当做 包 ， 目 录 下 必须 包含 init.py 文件 ; 这 样 做 是 为 了 防止 一 个 具有 常 
RAF (例如 string) 的 目录 无 意中人 隐藏 目录 搜索 路 径 中 正确 的 模块 。 最 简单 的 情况 
F, initpy 可 以 只 是 一 个 空 的 文件 ， 但 它 也 可 以 为 包 执 行 初始 化 代码 或 设置 all 变 量 (RES 


介绍 ) 。 


用 户 可 以 从 包 中 导入 单独 的 模块 ， 例 如 : 


import sound.effects.echo 


这 样 就 加 载 了 子 模 块 sound.effects.echo。 它 必须 使 用 其 完整 名 称 来 引用 。 


sound.effects.echo.echofilter(input, output, delay=0.7, atten=4) 


导入 子 模块 的 另 一 方法 是 : 


from sound.effects import echo 


这 同样 也 加 载 了 子 模块 echo， 但 使 它 可 以 不 用 包 前 级 访问 ， 因 此 它 可 以 按 如 下 方式 使 用 : 


echo.echofilter(input, output, delay=0.7, atten=4) 


还 有 另 一 种 变化 方式 是 直接 导入 所 需 的 函数 或 变量 : 


from sound.effects.echo import echofilter 


这 再 次 加 载 了 子 模块 echo， 但 这 种 方式 使 函数 echofilter() 可 以 直接 访问 : 


echofilter(input, output, delay=0.7, atten=4) 


注意 使 用 rompackageimportitem 时 ，item 可 以 是 包 的 子 模块 (或 子 包 ) ， 也 可 以 是 包 中 定义 
的 一 些 其 它 的 名 称 ， 上 比如 画 数 、 类 或 者 变量 。import 语 名 首先 测试 item 在 包 中 是 否 有 定义 ; 
如 果 没 有 ， 它 假定 它 是 一 个 模块 ， 并 党 试 加 载 它 。 如 果 未 能 找到 ， 则 引发 ImportError 异 常 。 


相反 ， 使 用 类 似 importitem.subitem.subsubitem 这 样 的 语法 时 ， 除 了 最 后 一 项 其 它 每 项 必须 
是 一 个 包 ; 最 后 一 项 可 以 是 一 个 模块 或 一 个 包 ， 但 不 能 是 在 前 一 个 项 目 中 定义 的 类 、 画 数 或 


t£. 


6.4.1. 从 乌 中 导入 * 


那么 现在 如 果 用 户 写 成 fromsound.effectsimport* 会 发 生 什 么 ?理想 情况 下 ， 他 应 该 是 希望 到 
文件 系统 中 寻找 包 里 面 有 哪些 子 模块 ， 并 把 它们 全 部 导入 进来 。 这 可 能 需要 很 长 时 间 ， 而 且 
导入 子 模块 可 能 会 产生 想不到 的 副作用 ， 这 些 作 用 本 应 该 只 有 当 子 模块 是 显 式 导 人 时 才 会 发 
^t. 


唯一 的 解决 办 法 是 包 的 作者 为 包 提供 显 式 的 索引 。import 语句 使 用 以 下 约定 : 如 果 包 中 的 
init.py 代码 定义 了 一 个 名 为 all 的 列表 ， 那 么 在 遇 到 ffompackageimport 语 名 的 时 候 ， 应 该 把 
这 个 列表 中 的 所 有 模块 名 字 导 入 。 当 包 有 新 版 本 包 发 布 时 ， 就 需要 包 的 作者 更 新 这 个 列表 
了 。 如 果 包 的 作者 认为 不 可 以 用 import 方式 导 人 它们 的 包 ， 也 可 以 决定 不 支持 它 。 例 如 ， 文 
件 sound/effects/init.py 可 以 包含 下 面 的 代码 : 


all  - ["echo", "surround", "reverse"] 


这 意味 着 ffomsound.effectsimport 44 A. sound 包 的 三 个 子 模块 。 


如 果 all ZA EL, fromsound.effectsimport 语句 不 * 会 从 sound.effects 包 中 导入 所 有 的 子 
模块 到 当前 命名 空间 ; ERIRE sound.effects 包 已 经 被 导入 (可 能 会 运行 init.py 中 的 任何 初 
始 化 代码 ) ， 然 后 导入 包 中 定义 的 任何 名 称 。 这 包括 由 init.py 定义 的 任何 名 称 AREER 
加 载 的 子 模块 ) 。 还 包括 这 个 包 中 已 经 由 前 面 的 import 语句 显 式 加 载 的 子 模块 。 请 考虑 此 代 
码 : 


import sound.effects.echo 
import sound.effects.surround 
from sound.effects import * 


在 这 个 例子 中 ， 执 行 fom...import at, echo 和 surround 模块 被 导入 到 当前 命名 空间 是 
因为 它们 在 sound.effects 中 有 定义 。 (定义 了 all 时 也 会 同样 工作 。) 


虽然 某 些 模块 设计 成 使 用 import* 时 只 导出 符合 特定 模式 的 名 称 ， 在 产品 代码 中 使 用 这 种 写法 
仍然 是 不 好 的 做 法 。 


记 住 ， 使 用 fromPackageimportspecific_submodule 一 点 没 错 ! 事实 上 ， 这 是 推荐 的 写法 ， 
除非 导入 的 模块 需要 使 用 其 它 包 中 的 同名 子 模块 。 


6.4.2. 包 内 引用 


子 模块 通常 需要 相互 引用 。 例 如 ，surround 模块 可 能 会 使 用 echo 模块 。 事 实 上 ， 这 种 引用 
是 如 此 常见 以 致 import 语句 会 在 标准 模块 搜索 路 径 之 前 首先 在 所 在 的 包 中 查找 。 因 此 ， 
surround 模块 可 以 简单 地 使 用 importecho 或 fromechoimportechofilter。 如 果 在 当前 包 (当前 
模块 属于 其 子 模块 的 包 ) 中 未 找到 要 导入 的 模块 ，import 语句 会 查找 具有 给 定名 称 的 项 级 模 
Ro 


如 果 一 个 包 是 子 包 (比如 例子 中 的 sound 8) ， 你 可 以 使 用 绝对 导入 来 引用 兄弟 包 的 子 模 
块 。 例 如 ， 如 果 模 块 sound.filters.vocoder 需要 使 用 sound.effects 包 中 的 echo 模块 ， 它 可 以 
使 用 ffomsound.effectsimportecho。 


Python 2.5 开始 ， 除 了 上 面 描述 的 隐 式 相对 导入 ， 你 可 以 使 用 frommoduleimportname 的 导入 
形式 编写 显 式 相 对 导入 。 这 些 显 式 的 相对 导入 使 用 前 导 的 点 号 表示 相对 导入 的 是 从 当前 包 还 
是 上 级 的 包 。 以 surround 模块 为 例 ， 你 可 以 使 用 : 


from . import echo 
from .. import formats 
from ..filters import equalizer 


注意 ， 显 式 和 隐 式 相对 导入 都 基于 当前 模块 的 名 称 。 因 为 主 模 块 的 名 字 总 是 "main", Python 
应 用 程序 的 主 模 块 应 该 总 是 用 绝对 导入 。 


6.4.3. 包含 多 个 目录 的 包 


包 还 支持 一 个 特殊 的 属性 ， path。 在 文件 运行 之 前 ， 该 变量 被 初始 化 为 一 个 包含 init.py 所 在 
目录 的 列表 。 这 个 变量 可 以 修改 ; 这 样 做 会 影响 未 来 包 中 包含 的 模块 和 子 包 的 搜索 。 


虽然 通常 不 需要 此 功能 ， 它 可 以 用 于 扩展 包 中 的 模块 的 集合 。 
脚注 


| [1] | 实际 上 ， 画 数 的 定义 也 是 ' 执 行 过 ' 的 ' 语 名 ' ; 模块 级 别 的 画 数 定义 的 执行 将 画 数 名 放 入 该 
模块 的 全 局 符号 表 中 。 | |-----|-----| 


7. 输入 和 输出 


展现 程序 的 输出 有 多 种 方法 ; 可 以 打印 成 人 类 可 读 的 形式 ， 也 可 以 写 入 到 文件 以 便 后 面 使 
用 。 本 章 将 讨论 其 中 的 几 种 方法 。 


7.1. 格式 化 输出 


到 目前 为 止 我 们 遇 到 过 两 种 输出 值 的 方法 : 表达 式 语 句 和 print 语 句 。 (第 三 个 方式 是 使 用 文 
件 对 象 的 write() 方 法 ; 标准 输出 文件 可 以 引用 sys.stdout。 详 细 内 容 参 见 库 参 考 手 册 。 ) 


通常 你 会 希望 更 好 地 控制 输出 的 格式 而 不 是 简单 地 打印 用 空格 分 隔 的 值 。 有 两 种 方法 来 设置 
输出 格式 ; 第 一 种 方式 是 自己 做 所 有 的 字符 串 处 理 ; 使 用 字符 串 切 片 和 连接 操作 ， 你 可 以 创 
建 任何 你 能 想象 到 的 布局 。 字 符 串 类 型 有 一 些 方法 ， 用 于 执行 将 字符 串 填充 到 指定 列 宽度 的 
有 用 操作 ; 这 些 稍 后 将 讨论 。 第 二 种 方法 是 使 用 strformat() 方 法 。 


string 模 块 包含 一 个 Template 类 ， 提 供 另 外 一 种 向 字符 串 代 入 值 的 方法 。 


当然 还 有 一 个 问题 : 如 何 将 值 转换 为 字符 串 ?幸运 的 是 ，Python 有 方法 将 任何 值 转 换 为 字符 
串 : 将 它 传递 给 repr() 或 str() 函 数 。 


str() 函 数 的 用 意 在 于 返回 人 类 可 读 的 表现 形式 ， 而 repr() 的 用 意 在 于 生成 解释 器 可 读 的 表现 形 
X 《如果 没有 等 价 的 语法 将 会 引发 SyntaxError 异 常 ) 。 对 于 对 人 类 并 没有 特别 的 表示 形式 的 
对 象 ， str() 和 repr() 将 返回 相同 的 值 。 许 多 值 ， 例 如 数字 或 者 列表 和 字典 这 样 的 结构 ， 使 用 这 
两 个 图 数 中 的 任意 一 个 都 具有 相同 的 表示 形式 。 特 别 地 ， 字 符 串 和 浮 点 数 有 两 种 不 同 的 表示 
形式 。 


一 些 例子 : 


>>> s = 'Hello, world.' 
>>> str(s) 

"dello, world.' 

>>> repr(s) 

"'Hello, world.'" 
>>> str(1.0/7.0) 
'0.142857142857' 

>>> repr(1.0/7.0) 
'0.14285714285714285' 
>>> x = 10 * 3.25 
>>> y = 200 * 200 


>>> s = 'The value of x is ' + repr(x) + ', and y is ' + repr(y) + '... 


>>> print s 
The value of x is 32.5, and y is 40000... 
>>> # The repr() of a string adds string quotes and backslashes: 
... hello = 'hello, world\n' 
>>> hellos = repr(hello) 
>>> print hellos 
"hello, world\n' 
>>> # The argument to repr() may be any Python object: 
repr((x, y, ('spam', 'eggs'))) 
"(32.5, 40000, ('spam', 'eggs'))" 


这 里 用 两 种 方法 输出 平方 和 立方 表 : 


>>> for x in range(1, 11): 
print repr(x).rjust(2), repr(x*x).rjust(3), 
# Note trailing comma on previous line 
print repr(x*x*x).rjust(4) 
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>>> for x in range(1, 11): 
print '{0:2d} {1:3d} {2:4d}'.format(x, x*x, x*x*x) 


oO - O01 ^» 0 MN FE: 
ES 
Oo 
Oo 
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9 81 729 
10 100 1000 


(注意 在 第 一 个 示例 中 ， 每 列 之 间 的 一 个 空格 由 print 自 动 添加 : 它 总 会 在 它 的 参数 之 间 添 加 
空格 。 ) 


上 面 的 例子 演示 了 字符 串 对 象 的 strrjust() 方 法 ， 它 通过 在 左 侧 填充 空格 使 字符 串 在 给 定 宽度 的 
列 右 对 齐 。 类 似 的 方法 还 有 str.ljust() 和 str.center()。 这 些 方法 不 会 输出 任何 内 容 ， 它 们 只 返回 
新 的 字符 串 。 如 果 输 入 的 字符 串 太 长 ， 它 们 不 会 截断 字符 串 ， 而 是 保持 原样 返回 ; 这 会 使 列 
的 格式 变 得 混乱 ， 但 是 通常 好 于 另外 一 种 选择 ， 那 可 能 是 一 个 错误 的 值 。 (如 果 你 真 的 想 
截断 ， 可 以 加 上 一 个 切片 操作 ， 例 如 x.ljust(n)[:n]。) 


另外 一 种 方法 str.zfill()， 它 向 数值 字符 捉 左 侧 填 充 需 。 该 娘 数 可 以 正确 识别 正 负 号 : 


>>> '12'.zfill(5) 

'00012' 

>>> '-8.414'.zfill(7) 

' -003.14' 

»»» '8.14159265359'.zfill(5) 
'3.14159265359' 


strformat() 方 法 的 基本 用 法 如 下 所 示 : 


>>> print 'We are the {} who say "{}!"'.format('knights', 'Ni') 
We are the knights who say "Ni!" 


花 括号 及 其 中 的 字符 〈 称 为 格式 字段 ) 将 被 替换 为 传递 给 str.format() 方 法 的 对 象 。 括 号 中 的 数 
字 指 传递 给 str.format() 方 法 的 对 象 的 位 置 。 


>>> print '{0} and {1}'.format('spam', 'eggs') 
spam and eggs 
>>> print '{1} and {0}'.format('spam', 'eggs') 
eggs and spam 


如 果 strformat() 方 法 使 用 关键 字 参 数 ， 那 么 将 通过 参数 名 引用 它们 的 值 。 


>>> print 'This {food} is {adjective}.'.format( 
food='spam', adjective='absolutely horrible') 
This spam is absolutely horrible. 


置 参 数 和 关键 字 参 数 可 以 随意 组 合 : 


>>> print 'The story of {0}, {1}, and {other}.'.format('Bill', 'Manfred', 
Sus other='Georg' ) 
The story of Bill, Manfred, and Georg. 


"s (适用 str()) 和 "Ilr" (适用 repr()) 可 以 用 于 值 被 格式 化 之 前 对 值 进行 转换 。 


>>> import math 

>>> print 'The value of PI is approximately {}.'.format(math.pi) 
The value of PI is approximately 3.14159265359. 

>>> print 'The value of PI is approximately {!r}.'.format(math.pi) 
The value of PI is approximately 3.141592653589793. 


字段 名 后 允许 可 选 的 "和 格式 指令 。 这 允许 更 好 地 控制 如 何 设置 值 的 格式 。 下 面 的 例子 将 P 
转 为 三 位 精度 。 


>>> import math 
>>> print 'The value of PI is approximately {0:.3f}.'.format(math.pi) 
The value of PI is approximately 3.142. 


"后面 紧 跟 一 个 整数 可 以 限定 该 字段 的 最 小 宽度 。 这 在 美化 表格 时 很 有 用 。 


>>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 7678} 


>>> for 


Jack 
Dcab 
Sjoerd 


如 果 你 有 一 


name, phone in table.items(): 
print '{0:10} ==> {1:10d}'.format(name, phone) 


==> 4098 
==> 7678 
==> 4127 


个 实在 是 很 长 的 格式 字符 串 但 又 不 想 分 开 写 ， 要 是 可 以 按照 名 字 而 不 是 位 置 引用 


变量 就 好 了 。 有 个 简单 的 方法 ， 可 以 传人 一 个 字典 ， 然 后 使 用 由 访问 。 


>>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678} 


>>> print ('Jack: {@[Jack]:d}; Sjoerd: {@[Sjoerd]:d}; 


'Dcab: {0[Dcab]:d}'.format(table) ) 


Jack: 4098; Sjoerd: 4127; Dcab: 8637678 


这 也 可 以 用 “符号 将 这 个 字典 以 关键 字 参 数 的 方式 传人 。 


>>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678} 
>>> print 'Jack: {Jack:d}; Sjoerd: {Sjoerd:d}; Dcab: {Dcab:d}'.format(**table) 
Jack: 4098; Sjoerd: 4127; Dcab: 8637678 


RMHBASABWMvars( MARRS, RESO [B] — I OL PIU FE 3E SSR, 


关于 strformat() 完 整 的 描述 ， 请 参见 格式 字符 串 语法 。 


7.1.1. 


旧式 的 字符 串 格 陈 


ee 它 将 左边 类 似 sprintf()- 风 格 的 参数 应 用 到 右边 的 参数 ， 然 


后 返 


这 种 格式 化 操作 生成 的 字符 串 。 例 如 : 


>>> import math 
>>> print 'The value of PI is approximately %5.3f.' % math.pi 
The value of PI is approximately 3.142. 


字符 串 格 式 化 操作 一 节 中 ， 可 以 找到 更 多 的 信息 。 


7.2. 读 写 文件 


open()i& 


一 个 文件 对 象 ， 最 常见 的 用 法 带 有 两 个 参数 : open(filename,mode). 


>>> f = open('workfile', 'w') 
>>> print f 
«open file 'workfile', mode 'w' at 80a0960> 


第 一 个 参数 是 一 个 含有 文件 名 的 字符 串 。 第 二 个 参数 也 是 一 个 字符 串 ， 含 有 描述 如 何 使 用 该 
文件 的 几 个 字符 。mmoae 为 "时 表示 只 是 读 取 文 件 ; w 表示 只 是 写 入 文件 (已 经 存在 的 同名 文 
Smale) ; 'a 表 示 打 开 文 件 进 行 追加 ， 写 入 到 文件 中 的 任何 数据 将 自动 添加 到 末 

尾 。'r+' 表 示 打 开 文 件 进 行 读 取 和 写 入 。mode 参数 是 可 选 的 ， 黑 认为 'r。 


在 Windows 平台 上 ， 模 式 后 面 追加 'b' 表 示 以 二 进 制 方式 打开 文件 ， 所 以 也 有 像 'rb'、 

'Wb' 和 'r+b' 这 样 的 模式 。Python 在 Windows 平台 上 区 分 文本 文件 和 二 进 制 文件 ; 读 取 或 写 入 
文本 文件 中 时 ， 行 尾 字符 会 被 自动 地 稍 加 改变 。 这 种 修改 对 ASCI 文本 文件 没有 问题 ， 但 会 
损坏 JPEG 或 EXE 这 样 的 二 进 制 文件 中 的 数据 。 在 读 写 这 些 文件 时 一 定 要 记得 以 二 进 制 模式 打 
Jf. f£ Unix 平台 上 ， 在 模式 后 面 附加 一 个 'b' 不 会 有 损坏 ， 因 此 你 可 以 用 它 来 读 写 任何 平台 
的 所 有 二 进 制 文件 。 


7.2.1. 文件 对 象 的 方法 
本 节 中 的 示例 将 假设 文件 对 象 f 已 经 创建 。 


要 读 取 文件 内 容 ， 可 以 调用 fread(size) ， 该 方法 读 取 若 干 数量 的 数据 并 以 字符 串 形 式 返回 其 
AR., size 是 可 选 的 数值 参数 。 当 size 被 省 略 或 者 为 负数 时 ， 将 会 读 取 并 返回 整个 文件 ; 如 
果 文件 大 小 是 你 机 器 内 存 的 两 倍 时 ， 就 是 你 的 问题 了 。 和 否则 ， 至 多 读 取 和 返回 size 大 小 的 字 
节 数据 。 如 果 到 了 文件 末尾 ，f.read() 会 返回 一 个 空 字符 串 (")。 


>>> f.read() 
'This is the entire file.\n' 
>>> f.read() 


freadline() 从 文件 读 取 一 行 数据 ; 字符 串 结尾 会 带 有 一 个 换行 符 (\n) ， 只 有 当 文 件 最 后 一 行 没 
有 以 换行 符 结尾 时 才 会 省 略 。 这 样 返回 值 就 不 会 有 混 浠 ， 如 果 freadline() 返 回 一 个 空 字 符 
串 ， 那 就 表示 已 经 达到 文件 的 末尾 ， 而 如 果 返 回 一 个 只 包含 一 个 换行 符 的 字符 串 \n',， 则 表示 


遇 到 一 个 空 行 。 


>>> f.readline() 

"This is the first line of the file.\n' 
>>> f.readline() 

"Second line of the file\n' 

>>> f.readline() 


你 可 以 循环 通 历 文件 对 象 来 读 取 文件 中 的 每 一 行 。 这 是 既 省 内 存 又 非常 快 的 简单 代码 : 


>>> for line in f: 
print line, 


This is the first line of the file. 
Second line of the file 


如 果 你 想 把 文件 中 的 所 有 行 读 到 一 个 列表 中 ， 你 也 可 以 使 用 list(f) 或 freadlines()。 


fwrite(string) 将 string 的 内 容 写 入 文件 中 并 返回 None。 


>>> f.write('This is a test\n') 


如 果 想 写 人 字符 串 以 外 的 数据 ， 需 要 先 将 它 转换 为 一 个 字符 串 : 


>>> value = ('the answer', 42) 
>>> s = str(value) 
>>> f.write(s) 


f.tell() 返 回 一 个 整数 ， 代 表 文 件 对 象 在 文件 中 的 指针 位 置 ， 该 数值 计量 了 自 文件 开头 到 指针 处 
的 比特 数 。 若 要 更 改 该 文件 对 象 的 位 置 ， 可 以 使 用 f.seek(offset,from_what)。 新 的 位 置 由 参考 
点 加 上 offset 计算 得 来 ， 参 考点 的 选择 则 来 自 于 from. what 参数 。from_what 值 为 0 表示 以 
文件 的 开始 为 参考 点 ，1 表示 以 当前 的 文件 位 置 为 参考 点 ，2 表示 以 文件 的 结尾 为 参考 

Fao from what 可 以 省 略 ， 黑 认 值 为 0， 表示 以 文件 的 开始 作为 参考 点 。 


>>> f = open('workfile', 'r+') 

>>> f.write('0123456789abcdef') 

>>> f.seek(5) # Go to the 6th byte in the file 
>>> f.read(1) 

15! 

>>> f.seek(-3, 2) # Go to the 3rd byte before the end 
>>> f.read(1) 

rq! 


使 用 完 一 个 文件 后 ， 调 用 f.close() 可 以 关闭 它 并 释放 其 占用 的 所 有 系统 资源 。 调 用 f.close() 
后 ， 再 党 试 使 用 该 文件 对 象 将 失败 。 


>>> f.close() 
>>> f.read() 
Traceback (most recent call last): 
File "<stdin>", line 1, in ? 
ValueError: I/O operation on closed file 


处 理 文件 对 象 时 使 用 with 关 键 字 是 很 好 的 做 法 。 这 样 做 的 好 你 在 于 文件 用 完 后 会 自动 关闭 ， 即 
使 过 程 中 发 生 异 常 也 没关系 。 它 还 比 编写 一 个 等 同 的 try-finally 语 句 要 短 很 多 : 


>>> with open('workfile', 'r') as f: 
: read data - f.read() 

>>> f.closed 

True 


文件 对 象 还 有 一 些 不 太 常 用 的 方法 ， 例 如 isatty() 和 truncate() ; 有 关 文件 对 象 的 完整 指南 ， 请 
参阅 Python 库 参 考 手 册 。 


7.2.2. 使 用 json 存 储 结构 化 数据 


从 文件 中 污 写 字符 串 很 容易 。 数 值 就 要 多 费 点 儿 周 折 ， 因 为 read () 方 法 只 会 返回 字符 串 ， 应 
将 其 传 入 int() 这 样 的 画 数 ， 就 可 以 将 '123' 这 样 的 字符 串 转 换 为 对 应 的 数值 123。 当 你 想 要 保存 
更 为 复杂 的 数据 类 型 ， 例 如 嵌 套 的 列表 和 字典 ， 手 工 解析 和 序列 化 它们 将 变 得 更 复杂 。 


好 在 用 户 不 是 非得 自己 编写 和 调试 保存 复杂 数据 类 型 的 代码 ，Python 允许 你 使 用 常用 的 数据 
交换 格式 JSON (JavaScript Object Notation) 。 标 准 模块 json 可 以 接受 Python 数据 结构 ， 
并 将 它们 转换 为 字符 串 表示 形式 ; 此 过 程 称 为 序列 化 。 从 字符 串 表 示 形 式 重新 构建 数据 结构 
称 为 反 序 列 化 。 序 列 化 和 反 序 列 化 的 过 程 中 ， 表 示 该 对 象 的 字符 串 可 以 存储 在 文件 或 数据 
中 ， 也 可 以 通过 网 络 连接 传送 给 远程 的 机 器 。 


As alie 
TER 


JSON 格式 经 常用 于 现代 应 用 程序 中 进行 数据 交换 。 许 多 程序 员 都 已 经 熟悉 它 了 ， 使 它 成 为 
相互 协作 的 一 个 不 错 的 选择 。 


如 果 你 有 一 个 对 象 x， 你 可 以 用 简单 的 一 行 代码 查看 其 JSON 字符 串 表 示 形 式 : 


>>> json.dumps([1, 'simple', 'list']) 
' [1, "simple", "list"] ' 
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打开 的 一 个 文件 对 象 ， 我 们 可 以 这 样 做 : 


json.dump(x, f) 


为 了 重新 解码 对 象 ， 如 果 f 是 为 读 取 而 打开 的 文件 对 象 : 


x = json.load(f) 


这 种 简单 的 序列 化 技术 可 以 处 理 列表 和 字典 ， 但 序列 化 任意 类 实例 为 JSON 需要 一 点 额外 的 
努力 。Json 模 块 的 手册 对 此 有 详细 的 解释 。 


另 请 参阅 


pickle - picklef +} 


与 JSON FE, pickle 是 一 个 协议 ， 它 允许 任意 复 条 的 Python 对 象 的 序列 化 。 因 此 ， 它 只 能 
用 于 Python 而 不 能 用 来 与 其 他 语言 编写 的 应 用 程序 进行 通信 。 默 认 情 况 下 它 也 是 不 安全 的 : 
如 果 数 据 由 熟练 的 攻击 者 精心 设计 ， 反 序 列 化 来 自 一 个 不 受信 任 源 的 pickle 数据 可 以 执行 任 
意 代码 。 


8. 错误 和 异常 


站 到 现在 ， 我 们 还 没有 更 多 的 提 及 错误 信息 ， 但 是 如 果 你 真 的 尝试 了 前 面 的 例子 ， 也 许 你 已 
经 见 到 过 一 些 。Python (至 少 ) 有 两 种 错误 很 容易 区 分 : 语法 错误 和 异常 。 


8.1. 语法 错误 
语法 错误 ， 或 者 称 之 为 解析 错误 ， 可 能 是 你 在 学 习 Python 过 程 中 最 烦 的 一 种 : 


>>> while True print 'Hello world' 
File "<stdin>", line 1, in ? 
while True print 'Hello world' 
^ 


SyntaxError: invalid syntax 


语法 分 析 器 指出 了 出 错 的 一 行 ， 并 且 在 最 先 找到 的 错误 的 位 置 标 记 了 一 个 小 小 的 "第 头 '"。 错 误 
是 由 箭头 前 面 的 标记 引起 的 (至 少 检测 到 是 这 样 的 ) : 在 这 个 例子 中 ， 检 测 到 关键 字 print 有 
问题 ， 因 为 在 它 之 前 缺少 一 个 冒号 〈'"") 。 文 件 名 和 行 号 会 一 并 输出 ， 所 以 如 果 运 行 的 是 一 个 
脚本 你 就 知道 去 哪里 检查 错误 了 。 


8.2. 异常 


即使 一 条 语句 或 表达 式 在 语法 上 是 正确 的 ， 在 运行 它 的 时 候 ， 也 有 可 能 发 生 错误 。 在 执行 其 
间 检 测 到 的 错误 被 称 为 异常 并 且 程 序 不 会 无 条 件 地 崩溃 : 你 很 快 就 会 知道 如 何在 Python 程 
序 中 处 理 它们 。 然 而 大 多 数 异 常 都 不 会 被 程序 处 理 ， 导 致 产生 类 似 下 面 的 错误 信息 : 


>>> 10 * (1/0) 
Traceback (most recent call last): 
File "<stdin>", line 1, in ? 
ZeroDivisionError: integer division or modulo by zero 
>>> 4 + spam*3 
Traceback (most recent call last): 
File "<stdin>", line 1, in ? 
NameError: name 'spam' is not defined 
>>> EM + 2 
Traceback (most recent call last): 
File "<stdin>", line 1, in ? 
TypeError: cannot concatenate 'str' and 'int' objects 


最 后 一 行 的 错误 消息 指示 发 生 了 什么 事 。 异 常 有 不 同 的 类 型 ， 其 类 型 会 作为 消息 的 一 部 分 打 
印 出 来 : 在 这 个 例子 中 的 类 型 有 ZeroDivisionError、 NameError 和 TypeError。 打 印 出 来 的 异 
常 类 型 的 字符 串 就 是 内 置 的 异常 的 名 称 。 这 对 于 所 有 内 和 置 的 异常 是 正确 的 ， 但 是 对 于 用 户 自 


定义 的 异常 就 不 一 定 了 〔 尽 管 这 是 非常 有 用 的 惯例 ) 。 标 准 异 常 的 名 称 都 是 内 置 的 标识 符 
(不 是 保留 的 关键 字 ) 。 


这 一 行 最 后 一 部 分 给 出 了 异常 的 详细 信息 和 引起 异常 的 原因 。 


给 误 信息 的 前 面部 分 以 堆栈 回溯 的 形式 显示 了 异常 发 生 的 上 下 文 。 通 常 调用 栈 里 会 包含 源 代 
码 的 行 信 息 ， 但 是 来 自 标准 输入 的 源码 不 会 显示 行 信息 。 


内 置 的 异常 列 出 了 内 置 的 异常 以 及 它们 的 含义 。 


8.3. 处 理 异 常 


可 以 通过 编程 来 选择 处 理 部 分 异常 。 看 一 下 下 面 的 例子 ， 它 会 一 直 要 求 用 户 输入 直到 输入 一 
个 合法 的 整数 为 止 ， 但 允许 用 户 中 断 这 个 程序 (使 用 Control-C 或 系统 支持 的 任何 方法 ) ; 注 
意 用 户 产生 的 中 断 引 发 的 是 Keyboardinterrupt 异常 。 


>>> while True: 
try: 
x = int(raw_input("Please enter a number: ")) 
break 
except ValueError: 
print "Oops! That was no valid number. Try again..." 


Try 语 句 按 以 下 方式 工作 。 


e 首先 ， 执 行 try 子 句 (try 和 except 关 键 字 之 间 的 语句 ) o 

e 如 果 未 发 生 任 何 异 常 ， 忽 略 except 子 句 且 try 语 句 执行 完毕 。 

e 如 果 在 try 子 句 执行 过 程 中 发 生 异 常 ， 跳 过 该 子 句 的 其 余部 分 。 如 果 异 常 的 类 型 与 except 
关键 字 后 面 的 异常 名 匹配 , 则 执行 except 子 句 ， 然 后 继续 执行 try 语 句 之 后 的 代码 。 

e 如 果 异 常 的 类 型 与 except 关键 字 后 面 的 异常 名 不 匹配 ， 它 将 被 传递 给 上 层 的 try 语 句 ; 如 
果 没 有 找到 处 理 这 个 异常 的 代码 ， 它 就 成 为 一 个 未 处 理 异 常 ， 程 序 会 终止 运行 并 显示 一 
条 如 上 所 示 的 信息 。 


Try 语 句 可 能 有 多 个 子 句 ， 以 指定 不 同 的 异常 处 理 程序 。 不 过 至 多 只 有 一 个 处 理 程 序 将 被 执 
行 。 处 理 程 序 只 处 理发 生 在 相应 try 子 句 中 的 异常 ， 不 会 处 理 同一 个 try 字 句 的 其 他 处 理 程 序 中 
发 生 的 有 异常。 一 个 except 子 句 可 以 用 带 括号 的 元 组 列 出 多 个 异常 的 名 字 ， 例 如 : 


. except (RuntimeError, TypeError, NameError): 
pass 


注意 ， 此 元 组 周围 的 括号 是 必需 的 ， 因 为 exceptValueError,e: 是 旧式 的 写法 ， 在 现代 Python 
中 通常 写成 exceptValueErrorase: (如 下 所 述 ) 。 为 了 保持 向 后 兼容 性 ， 旧 式 语 法 仍然 是 支 
持 的 。 这 意味 着 exceptRuntimeError TypeError 不 等 同 于 except(RuntimeError TypeError): 而 


= [B] TF exceptRuntimeErrorasTypeError: , 这 应 该 不 是 你 想 要 的 。 
最 后 一 个 except 子 句 可 以 省 略 异常 名 称 ， 以 当 作 通 配 符 使 用 。 使 用 这 种 方式 要 特别 小 心 ， 


为 它 会 隐藏 一 个 真实 的 程序 错误 ! 它 还 可 以 用 来 打印 一 条 错误 消息 ， 然 后 重新 引发 异常 (让 
调用 者 也 去 处 理 这 个 异常 ) 


import sys 


try: 
f 
s = f.readline() 


open('myfile.txt') 


i - int(s.strip()) 
except IOError as e: 

print "I/O error({0}): {1}".format(e.errno, e.strerror) 
except ValueError: 

print "Could not convert data to an integer." 
except: 

print "Unexpected error:", sys.exc_info()[0] 

raise 


try...except 语 句 有 一 个 可 选 的 else 子 句 ， 其 出 现时 ， 必 须 放 在 所 有 except 子 句 的 后 面 。 如 果 
需要 在 try 语句 没有 抛 出 异常 时 执行 一 些 代码 ， 可 以 使 用 这 个 子 句 。 例 如 : 


for arg in sys.argv[1:]: 

try: 
f = open(arg, 'r') 

except IOError: 
print 'cannot open', arg 

else: 
print arg, 'has', len(f.readlines()), 'lines' 
f.close() 


使 用 else 子 句 比 把 额外 的 代码 放 在 try 子 句 中 要 好 ， 因 为 它 可 以 避免 意外 捕获 不 是 由 try … 
except 语 名 保护 的 代码 所 引发 的 异常 。 


当 异 常 发 生 时 ， 它 可 能 带 有 相关 数据 ， 也 称 为 异常 的 参数 。 参 数 的 有 无 和 类 型 取决 于 异常 的 


类 型 。 


except 子 句 可 以 在 异常 名 (或 元 组 ) 之 后 指定 一 个 变量 。 这 个 变量 将 绑 定 于 一 个 异常 实例 ， 
同时 异常 的 参数 将 存放 在 实例 的 args 中 。 为 方便 起 见 ， 异 常 实例 定义 了 str() ， 因 此 异常 的 参 
数 可 以 直接 打印 而 不 必 引 用 .args。 


也 可 以 在 引发 异常 之 前 先 实例 化 一 个 异常 ， 然 后 向 它 添加 任何 想 要 的 属性 。 


>>> try: 
raise Exception('spam', 'eggs') 
. except Exception as inst: 


print type(inst) # the exception instance 
print inst.args # arguments stored in .args 
print inst 4 str allows args to be printed directly 


X, y = inst.args 
print 'x =', x 
print 'y z', y 


«type 'exceptions.Exception'» 
('spam', 'eggs') 

('spam', 'eggs') 

X = spam 

y = eggs 


XDEGRASEEBUSRAMS, MRCBASA, BASRA ASR SNR MOTOR, 


异常 义理 程序 不 仅 义理 直接 发 生 在 try 子 句 中 的 异常 ， 而 且 还 处 理 try 子 句 中 调用 的 函数 CE: 
至 间接 调用 的 男 数 ) 引发 的 异常 。 例 如 : 


>>> def this_fails(): 
x = 1/0 


>>> try: 
this_fails() 
. except ZeroDivisionError as detail: 
print 'Handling run-time error:', detail 


Handling run-time error: integer division or modulo by zero 


8.4. 引发 异常 
raise 语 句 允 许 程序 员 强 行 引发 一 个 指定 的 异常 。 例 如 : 


>>> raise NameError('HiThere' ) 
Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
NameError: HiThere 


raise 的 唯一 参数 指示 要 引发 的 异常 。 它 必须 是 一 个 异常 实例 或 异常 类 〈 从 Exception 派生 的 


x). 


如 果 你 确定 需要 引发 异常 ， 但 不 打算 处 理 它 ， 一 个 简单 形式 的 raise 语 句 允 许 你 重新 引发 异 


aly 


"me 


>>> try: 
raise NameError('HiThere') 
. except NameError: 
print 'An exception flew by!' 
raise 


An exception flew by! 

Traceback (most recent call last): 
File "«stdin»", line 2, in ? 

NameError: HiThere 


8.5. 用 户 定 义 的 异常 


程序 可 以 通过 创建 新 的 异常 类 来 命名 自己 的 异常 (Python 类 的 更 多 内 容 请 参见 类 ) 。 异 常 通 
常 应 该 继承 Exception 类 ， 直 接 继承 或 者 间接 继承 都 可 以 。 例 如 : 


>>> class MyError(Exception): 
def | init (self, value): 
self.value - value 
def | str (self): 
return repr(self.value) 


>>> try: 
raise MyError(2*2) 
. except MyError as e: 


print 'My exception occurred, value:', e.value 


My exception occurred, value: 4 

>>> raise MyError('oops!') 

Traceback (most recent call last): 
File "«stdin»", line 1, in ? 

. main .MyError: 'oops!' 


在 此 示例 中 ，Exception 默 认 的 init() 被 覆盖 了 。 新 的 行为 简单 地 创建 了 va/ue 属性 。 这 将 替换 
默认 的 创建 args 属性 的 行为 。 


异常 类 可 以 像 其 他 类 一 样 做 任何 事情 ， 但 是 通常 都 会 比较 简单 ， 只 提供 一 些 属性 以 允许 异常 
处 理 程序 获取 错误 相关 的 信息 。 创 建 一 个 能 够 引发 几 种 不 同 错误 的 模块 时 ， 一 个 通常 的 做 法 
是 为 该 模块 定义 的 异常 创建 一 个 基 类 ， 然 后 基于 这 个 基 类 为 不 同 的 错误 情况 创建 特定 的 子 


J oc 


class Error(Exception): 
"""Base class for exceptions in this module.""" 
pass 


class InputError(Error): 
"""Exception raised for errors in the input. 


Attributes: 
expr -- input expression in which the error occurred 
msg -- explanation of the error 


def _ init (self, expr, msg): 
self.expr - expr 
self.msg - msg 


class TransitionError(Error): 
"""Raised when an operation attempts a state transition that's not 


allowed. 
Attributes: 
prev -- state at beginning of transition 
next -- attempted new state 
msg -- explanation of why the specific transition is not allowed 


def _ init (self, prev, next, msg): 
self.prev - prev 
self.next - next 
self.msg - msg 


大 多 数 异 常 的 名 字 都 以 "Error" 结 尾 ， 类 似 于 标准 异常 的 命名 。 

很 多 标准 模块 中 都 定义 了 自己 的 异常 来 报告 在 它们 所 定义 的 函数 中 可 能 发 生 的 错误 。 类 这 一 
章 给 出 了 类 的 详细 信息 。 

8.6. 定义 清理 操作 

Try 语句 有 另 一 个 可 选 的 子 句 ， 目 的 在 于 定义 必须 在 所 有 情况 下 执行 的 清理 操作 。 例 如 : 


>>> try: 
raise KeyboardInterrupt 
. finally: 
print 'Goodbye, world!' 


Goodbye, world! 
KeyboardInterrupt 


不 管 有 没有 发 生 异 常 ， 在 离开 try 语 句 之 前 总 是 会 执行 finally 子 句 。 当 try 子 句 中 发 生 了 一 个 异 
常 ， 并 且 没 有 except 字 句 处 理 (或 者 异常 发 生 在 try 或 else 子 句 中 ) ， 在 执行 完 finally 子 句 后 将 
重新 引发 这 个 异常 。try 语 句 由 于 break、contine 或 return 语 句 离开 时 ， 同 样 会 执行 finally 子 
句 。 以 下 是 一 个 更 复杂 些 的 例子 (同时 有 except 和 finally 字 句 的 try 语 句 的 工作 方式 与 Python 
2.5 一 样 ) 


>>> def divide(x, y): 
try: 
result =x / y 
except ZeroDivisionError: 
print "division by zero!" 
else: 
print "result is", result 
finally: 
print "executing finally clause" 


>>> divide(2, 1) 

result is 2 

executing finally clause 

>>> divide(2, 0) 

division by zero! 

executing finally clause 

>>> divide("2", "1") 

executing finally clause 

Traceback (most recent call last): 
File "<stdin>", line 1, in ? 
File "<stdin>", line 3, in divide 

TypeError: unsupported operand type(s) for /: 'str' and 'str' 


正如 您 所 看 到 的 ， 在 任何 情况 下 都 会 执行 finally 子 句 。 由 两 个 字符 串 相 除 引 发 的 TypeErorsg 
常 没有 被 except 子 句 处 理 ， 因 此 在 执行 finally 子 句 后 被 重新 引发 。 


在 真实 的 应 用 程序 中 ， finally 子 句 用 于 释放 外 部 资源 (例如 文件 或 网 络 连接 ) ， 不 管 资源 的 使 
用 是 否 成 功 。 
8.7. 清理 操作 的 预定 义 


有 些 对 象 定义 了 在 不 需要 该 对 象 时 的 标准 清理 操作 ， 无 论 该 对 象 的 使 用 是 成 功 还 是 失败 。 看 
看 下 面 的 示例 ， 它 尝试 打开 一 个 文件 并 打印 其 内 容 到 屏幕 。 


for line in open("myfile.txt"): 
print line, 


这 段 代码 的 问题 就 是 代码 执行 完 之 后 它 还 会 让 文件 在 一 段 不 确定 的 时 间 内 保持 打开 状态 。 这 
在 简单 的 脚本 中 没什么 ， 但 是 在 大 型 应 用 程序 中 可 能 是 一 个 问题 。With 语 句 可 以 确保 像 文件 
这 样 的 对 象 总 能 及 时 准确 地 被 清理 掉 。 


with open("myfile.txt") as f: 
for line in f: 
print line, 


执行 该 语句 后 ， 文 件 F 将 始终 被 关闭 ， 即 使 在 处 理 某 一 行 时 遇 到 了 问题 。 其 它 对 象 
预定 义 的 清理 行为 要 查看 它们 的 文档 。 


9. X 


与 其 他 编程 语言 相 比 ，Python 的 类 机 制 用 最 少 的 语法 和 语义 引入 了 类 。 它 是 C++ 和 Modula- 
3 类 机 制 的 混合 。Python 的 类 提供 了 面向 对 象 编程 的 所 有 标准 功能 : 类 继承 机 制 允 许 有 多 个 
基 类 ， 继 承 的 类 可 以 履 盖 其 基 类 或 类 的 任何 方法 ， 方 法 能 够 以 相同 的 名 称 调用 基 类 中 的 方 
法 。 对 象 可 以 包含 任意 数量 和 种 类 的 数据 。 和 模块 一 样 ， 类 同样 具有 Python 的 动态 性 质 : 它 
们 在 运行 时 创建 ， 并 可 以 在 创建 之 后 进一步 修改 。 


用 C++ 术语 来 讲 ， 通 常情 况 下 类 成 员 ( 包 插 数 据 成 员 ) 是 公有 的 〈 其 它 情 况 见 下 文 私有 变量 
和 类 本 地 引用 ) ， 所 有 的 成 员 玉 数 都 是 虚 的 。 与 Modula-3 一 样 ， 在 成 员 方 法 中 没有 简便 的 
方式 引用 对 象 的 成 员 : 方法 函数 的 声明 用 显 式 的 第 一 个 参数 表示 对 象 本 身 ， 调 用 时 会 隐 式 地 
引用 该 对 象 。 与 Smalltalk 一 样 ， 类 本 身 也 是 对 象 。 这 给 导入 类 和 重 命名 类 提供 了 语义 上 的 合 
理性 。 与 C++ 和 Modula-3 不 同 ， 用 户 可 以 用 内 置 类 型 作为 基 类 进行 扩展 。 此 外 ， 像 C++ 一 
样 ， 类 实例 可 以 重 定义 大 多 数 带 有 特殊 语法 的 内 置 操 作 符 (算术 运算 符 、 下 标 等 ) 。 


(由 于 没有 统一 的 达成 共识 的 术语 ， 我 会 偶尔 使 用 SmallTalk 和 C++ 的 术语 。 我 比较 喜欢 用 
Modula-3 的 术语 ， 因 为 比 起 C++，Python 的 面向 对 象 语法 更 像 它 ， 但 是 我 想 很 少 有 读者 听 
说 过 它 。) 


9.1. 名 称 和 对 象 


对 象 是 独立 的 ， 多 个 名 字 (在 多 个 作用 域 中 ) 可 以 绑 定 到 同一 个 对 象 。 这 在 其 他 语言 中 称 为 
别名 。 第 一 次 粗略 浏览 Python 时 经 常 不 会 注意 到 这 个 特性 ， 而 且 人 处 理 不 可 变 的 基本 类 型 ( 数 
字 ， 字 符 串 ， 元 组 ) 时 忽略 这 一 点 也 没什么 问题 。 然 而 ， 在 Python 代码 涉及 可 变 对 象 如 列 
表 、 字典 和 大 多 数 其 它 类 型 时 ， 别 名 可 能 具有 意 想 不 到 语义 效果 。 这 通常 有 助 于 优化 程序 ， 
因为 别名 的 行为 在 某 些 方面 类 似 指 针 。 例 如 ， 传 递 一 个 对 象 的 开销 是 很 小 的 ， 因 为 在 实现 上 
只 是 传递 了 一 个 指针 ; 如 果 画 数 修 改 了 参数 传递 的 对 象 ， 调 用 者 也 将 看 到 变化 一 一 这 就 避免 
了 类 似 Pascal 中 需要 两 个 不 同 参 数 的 传递 机 制 。 


9.2. Python 作用 域 和 命名 空间 


在 介绍 类 之 前 ， 我 首先 要 告诉 你 一 些 有 关 Python 作用 域 的 的 规则 。 类 的 定义 非常 巧妙 的 运用 
了 命名 空间 ， 要 完全 理解 接 下 来 的 知识 ， 需 要 先 理 解 作 用 域 和 命名 空间 的 工作 原理 。 另外 ， 
这 一 切 的 知识 对 于 任何 高 级 Python 程序 员 都 非常 有 用 。 


让 我 们 从 一 些 定 义 开 始 。 


命名 空间 是 从 名 称 到 对 象 的 映射 。 当 前 命名 空间 主要 是 通过 Python 字典 实现 的 ， 不 过 通常 不 
会 引起 任何 关注 〈 除 了 性 能 方面 ) ， 它 以 后 也 有 可 能 会 改变 。 以 下 有 一 些 命名 空间 的 例子 : 
内 置 名 称 集 《包括 本 数 名 例如 abs() 和 内 置 异 常 的 名 称 ) ; 模块 中 的 全 局 名 称 BRI 


局 部 名 称 。 在 某 种 意义 上 的 一 组 对 象 的 属性 也 形成 一 个 命名 空间 。 关 于 命名 空间 需要 知道 的 
重要 一 点 是 不 同 命名 空间 的 名 称 绝 对 没有 任何 关系 ; Ol, ARAB T ELE XE 3C ER ZR 
maximize 而 不 会 产生 混淆 模块 的 使 用 者 必须 以 模块 名 为 前 级 引用 它们 。 





顺便 说 一 句 ， 我 使 用 属性 这 个 词 称呼 点 后 面 的 任何 名 称 例如 ， 在 表达 式 z.real 中 ，real 
是 z 对 象 的 一 个 属性 。 严 格 地 说 ， 对 模块 中 的 名 称 的 引用 是 属性 引用 : 在 表达 式 
modname.funcname 中 ， modname 是 一 个 模块 对 象 ，funcname 是 它 的 一 个 属性 。 在 这 种 情 
况 下 ， 模 块 的 属性 和 模块 中 定义 的 全 局 名 称 之 间 碰 巧 是 直接 的 映射 : 它们 共享 同一 命名 空间 
! [1] 


属性 可 以 是 只 读 的 也 可 以 是 可 写 的 。 在 后 一 种 情况 下 ， 可 以 对 属性 赋值 。 模 块 的 属性 都 是 可 
BW : 你 可 以 这 样 写 modname.the_answer=42。 可 宇 的 属性 也 可 以 用 del 语 句 删除 。 例 如 ， 
delmodname.the_answer 将 会 删除 对 象 modname 中 的 the_answer 属 性 。 





各 个 命名 空间 创建 的 时 刻 是 不 一 样 的 ， 且 有 着 不 同 的 生命 周期 。 包 含 内 置 名 称 的 命名 空间 在 
Python 解释 器 启动 时 创建 ， 永 远 不 会 被 删除 。 模 块 的 全 局 命名 空间 在 读 人 模块 定义 时 创建 ; 
通常 情况 下 ， 模 块 命名 空间 也 会 一 直 保存 到 解释 器 退出 。 在 解释 器 最 外 层 调 用 执行 的 语句 ， 
不 管 是 从 脚本 文件 中 读 人 还 是 来 自 交 互 式 输 入 ， 都 被 当 作 模块 main 的 一 部 分 ， 所 以 它们 有 它 
们 自己 的 全 局 命名 空间 。( 内 置 名 称 实际 上 也 存在 于 一 个 模块 中 ， 这 个 模块 叫 builtin。) 


豆 数 的 局 部 命名 空间 在 辑 数 调 用 时 创建 ， 在 玉 数 返回 或 者 引发 了 一 个 函数 内 部 没有 人 处理 的 异 
常 时 删除 。 (实际 上 ， 用 遗忘 来 形容 到 底 发 生 了 什么 更 为 贴切 。) 当 然 ， 每 个 递 当 调用 有 它们 
自己 的 局 部 命名 空间 。 


作用 域 是 Python 程序 中 可 以 直接 访问 一 个 命名 空间 的 代码 区 域 。 这 里 的 "直接 访问 "的 意思 是 
用 没有 前 级 的 引用 在 命名 空间 中 找到 的 相应 的 名 称 。 


虽然 作用 域 的 确定 是 静态 地 ， 但 它们 的 使 用 是 动态 地 。 程 序 执行 过 程 中 的 任何 时 候 ， 至 少 有 
三 个 嵌 套 的 作用 域 ， 它 们 的 命名 空间 是 可 以 直接 访问 的 : 


。 首先 搜索 最 里 面包 含 局 部 命名 的 作用 域 

。 其 次 搜索 所 有 调用 孙 数 的 作用 域 ， 从 最 内 层 调用 孙 数 的 作用 域 开 始 ， 它 们 包含 非 局 部 但 
也 非 全 局 的 命名 

。 倒数 第 二 个 搜索 的 作用 域 是 包含 当前 模块 全 局 命名 的 作用 域 

。 最 后 搜索 的 作用 域 是 最 外 面包 含 内 置 命名 的 命名 空间 


如 果 一 个 命名 声明 为 全 局 的 ， 那 么 对 它 的 所 有 引用 和 赋值 会 直接 搜索 包含 这 个 模块 全 局 命名 
的 作用 域 。 否 则 ， 在 最 里 面 作用 域 之 外 找到 的 所 有 变量 都 是 只 读 的 (对 这 样 的 变量 赋值 会 在 
最 里 面 的 作用 域 创 建 一 个 新 的 局 部 变量 ， 外 部 具有 相同 命名 的 那个 变量 不 会 改变 ) 。 


通常 情况 下 ， 局 部 作用 域 引用 当前 函数 的 本 地 命名 。 画 数 之 外 ， 局 部 作用 域 引用 的 命名 空间 
与 全 局 作用 域 相同 : 模块 的 命名 空间 。 类 定义 在 局 部 命名 空间 中 创建 了 另 一 个 命名 空间 。 


认识 到 作用 域 是 由 代码 确定 的 是 非常 重要 的 : 函数 的 全 局 作用 域 是 函数 的 定义 所 在 的 模块 的 
命名 空间 ， 和 与 范 数 调用 的 位 置 或 者 别名 无 关 。 另 一 方面 ， 命 名 的 实际 搜索 过 程 是 动态 的 ， 在 
运行 时 确定 的 一 一 然而 ，Python 语言 也 在 不 断 发 展 ， 以 后 有 可 能 会 成 为 静态 的 “编译 ”时 确 
定 ， 所 以 不 要 依赖 动态 解析 ! (事实 上 ， 本 地 变量 是 已 经 确定 静态 。) 


Python 的 一 个 特别 之 处 在 于 一 一 如 果 没 有 使 用 global 语 法 一 一 其 赋值 操作 总 是 在 最 里 层 的 作用 
域 。 赋 值 不 会 复制 数据 一 只 是 将 命名 绑 定 到 对 象 。 删 除 也 是 如 此 : delx 只 是 从 局 部 作用 域 的 
命名 空间 中 删除 命名 x。 事 实 上 ， 所 有 引入 新 命名 的 操作 都 作用 于 局 部 作用 域 : 特别 是 import 
语句 和 画 数 定义 将 模块 名 或 函数 绑 定 于 局 部 作用 域 。( 可 以 使 用 Global 语句 将 变量 引入 到 全 局 
作用 域 。) 








9.3. 初 识 类 


类 引入 了 少量 的 新 语法 、 三 种 新 对 象 类 型 和 一 些 新 语义 。 


类 定义 的 最 简单 形式 如 下 所 示 : 


class ClassName: 
<statement-1> 


<statement -N> 


类 的 定义 就 像 画 数 定义 (defi) ， 要 先 执行 才能 生效 。( 你 当然 可 以 把 它 放 进 if 语句 的 某 一 
分 支 ， 或 者 一 个 函数 的 内 部 。) 

实际 应 用 中 ， 类 定义 包含 的 语句 通常 是 画 数 定义 ， 不 过 其 它 语句 也 是 可 以 的 而 且 有 时 还 会 很 
有 用 一 一 后 面 我 们 会 下 回来 讨论 。 类 中 的 函数 定义 通常 有 一 个 特殊 形式 的 参数 列表 ， 这 是 由 
方法 调用 的 协议 决定 的 一 一 同样 后 面 会 解释 这 些 。 





进入 类 定义 部 分 后 ， 会 创建 出 一 个 新 的 命名 空间 ， 作 为 局 部 作用 域 一 一 因此 ， 所 有 的 赋值 成 
为 这 个 新 命名 空间 的 局 部 变量 。 特 别 是 这 里 的 事 数 定义 会 绑 定 新 逆 数 的 名 字 。 


类 定义 正常 结束 时 ， 一 个 类 对 象 也 就 创建 了 。 基 本 上 它 是 对 类 定义 创建 的 命名 空间 进行 了 一 
个 包装 ; 我 们 在 下 一 节 将 进一步 学 习 类 对 象 的 知识 。 原 始 的 局 部 作用 域 (类 定义 引入 之 前 生 
效 的 那个 ) 得 到 恢复 ， 类 对 象 在 这 里 绑 定 到 类 定义 头 部 的 类 名 〈 例 子 中 是 ClassName) 。 


9.3.2. 类 对 象 


类 对 象 支持 两 种 操作 : 属性 引用 和 实例 化 。 


属性 引用 使 用 和 Python 中 所 有 的 属性 引用 一 样 的 标准 语法 : obj.name。 有 效 的 属性 名 称 是 在 
该 类 的 命名 空间 中 的 类 对 象 被 创建 时 的 所 有 名 称 。 因 此 ， 如 果 类 定义 看 起 来 像 这 样 : 


class MyClass: 
"""A simple example class""" 
i = 12345 
def f(self): 
return 'hello world' 


那么 MyClass.i 和 MyClass.f 是 有 效 的 属性 引用 ， 分 别 返回 一 个 整数 和 一 个 方法 对 象 。 也 可 以 
对 类 属性 赋值 ， 你 可 以 通过 给 MyClass.i 赋值 来 修改 它 。doc 也 是 一 个 有 效 的 属性 ， 返 回 类 
的 文档 字符 串 : "Asimpleexampleciass". 


类 的 实例 化 使 用 函数 的 符号 。 可 以 假设 类 对 象 是 一 个 不 带 参数 的 函数 ， 该 酚 数 返回 这 个 类 的 
一 个 新 的 实例 。 例 如 (假设 治 用 上 面 的 类 ) 


x = MyClass() 


创建 这 个 类 的 一 个 新 实例 ， 并 将 该 对 象 赋 给 局 部 变量 x。 


实例 化 操作 〈“ 调 用 "一 个 类 对 象 ) 将 创建 一 个 空 对 象 。 很 多 类 希望 创建 的 对 象 可 以 自 定义 一 个 
初始 状态 。 因 此 类 可 以 定义 一 个 名 为 init() 的 特殊 方法 ， 像 下 面 这 样 : 


def | init (self): 
self.data - [] 


当 类 定义 了 init() 方 法 ， 类 的 实例 化 会 为 新 创建 的 类 实例 自动 调用 init()。 所 以 在 下 面 的 示例 
中 ， 可 以 获得 一 个 新 的 、 已 初始 化 的 实例 : 


x = MyClass() 


当然 ，init() 方 法 可 以 带 有 参数 ， 这 将 带 来 更 大 的 灵活 性 。 在 这 种 情况 下 ， 类 实例 化 操作 的 参 
数 将 传递 给 init()。 例 如 ， 


>>> class Complex: 
def _ init (self, realpart, imagpart): 
self.r = realpart 
self.i = imagpart 


>>> x = Complex(3.0, -4.5) 
>>> Malt, Mai 
(3.0, -4.5) 


9.3.3. 实例 对 象 


现在 我 们 可 以 用 实例 对 象 做 什么 ? 实例 对 象 唯一 可 用 的 操作 就 是 属性 引用 。 有 两 种 有 效 的 属 
性 名 : 数据 属性 和 方法 。 


数据 属性 相当 于 Smalltalk 中 的 "实例 变量 "或 C++ 中 的 "数据 成 员 "。 数 据 属性 不 需要 声明 ; 和 
局 部 变量 一 样 ， 它 们 会 在 第 一 次 给 它们 赋值 时 生成 。 例 如 ， 如 果 x 是 上 面 创建 的 MyClass 的 实 
例 ， 下 面 的 代码 段 将 打印 出 值 16 而 不 会 出 现 错误 : 


x.counter = 1 

while x.counter < 10: 
x.counter = x.counter * 2 

print x.counter 

del x.counter 


实例 属性 引用 的 另 一 种 类 型 是 方法 。 方 法 是 "属于 "一 个 对 象 的 函数 。 (在 Python， 方 法 这 个 
术语 不 只 针对 类 实例 : 其 他 对 象 类 型 也 可 以 具有 方法 。 例 如 ， 列 表 对 象 有 append, insert, 
remove, sort 方法 等 等 。 但 是 在 后 面 的 讨论 中 ， 除 非 明确 说 明 ， 我 们 提 到 的 方法 特 指 类 实例 
对 象 的 方法 。) 


实例 对 象 的 方法 的 有 效 名 称 依赖 于 它 的 类 。 根 据 定义 ， 类 中 所 有 阔 数 对 象 的 属性 定义 了 其 实 
例 中 相应 的 方法 。 所 以 在 我 们 的 示例 中 ，x.f 是 一 个 有 效 的 方法 的 引用 ， 因 为 MyClass.f 是 一 个 
函数 ， 但 x.i 不 是 ， 因 为 MyClass.i 不 是 一 个 画 数 。 但 x. 侍 MyClass.f 也 不 是 一 回 事 一 一 它 是 一 
个 方法 对 象 ， 不 是 一 个 函数 对 象 。 


9.3.4. 方法 对 象 
通常 情况 下 ， 方 法 在 绑 定 之 后 被 直接 调用 : 


x.f() 


在 MyClass 的 示例 中 ， 这 将 返回 字符 串 'helloworld'。 然 而 ， 也 不 是 一 定 要 直接 调用 方法 : xf 
是 一 个 方法 对 象 ， 可 以 存储 起 来 以 后 调用 。 例 如 : 


Xho 
while True: 
print xf() 


会 不 断 地 打印 helloworld。 


调用 方法 时 到 底 发 生 了 什么 ?你 可 能 已 经 注意 到 ， 上 面 x.f() 的 调用 没有 参数 ， 即 使 f () 本 数 的 
定义 指定 了 一 个 参数 。 该 参数 发 生 了 什么 问题 ? 当然 如 果 辑 数 调用 中 缺少 参数 Python 会 抛 出 
异常 一 一 即使 这 个 参数 实际 上 没有 合用... 


实际 上 ， 你 可 能 已 经 猜 到 了 答案 : 方法 的 特别 之 处 在 于 实例 对 象 被 作为 函数 的 第 一 个 参数 传 
给 了 加 数 。 在 我 们 的 示例 中 ， 调 用 x.f() 完 全 等 同 于 MyClass.f(x)。 一 般 情 况 下 ， 以 n 个 参数 的 
列表 调用 一 个 方法 就 相当 于 将 方法 所 属 的 对 象 插入 到 列表 的 第 一 个 参数 的 前 面 ， 然 后 以 新 的 
列表 调用 相应 的 函数 。 


如 果 你 还 是 不 明白 方法 的 工作 原理 ， 了 解 一 下 它 的 实现 或 许 有 帮助 。 引 用 非 数据 属性 的 实例 
属性 时 ， 会 搜索 它 的 类 。 如 果 这 个 命名 确认 为 一 个 有 效 的 函数 对 象 类 属性 ， 就 会 将 实例 对 象 
AIRE xt RET TARR: 这 就 是 方法 对 象 。 以 一 个 参数 列表 调用 方法 对 象 时 ， 它 被 
重新 拆 封 ， 用 实例 对 象 和 原始 的 参数 列表 构造 一 个 新 的 参数 列表 ， 然 后 男 数 对 象 调用 这 个 新 
的 参数 列表 。 


9.3.5. 类 和 实例 变量 
一 般 来 说 ， 实 例 变量 用 于 对 每 一 个 实例 都 是 唯一 的 数据 ， 类 变量 用 于 类 的 所 有 实例 共享 的 属 
性 和 方法 : 
class Dog: 
kind = 'canine' # class variable shared by all instances 


def | init (self, name): 
self.name - name # instance variable unique to each instance 


>>> d = Dog('Fido') 
>>> e = Dog('Buddy') 


>>> d.kind # shared by all dogs 
'canine' 

>>> e.kind # shared by all dogs 
'canine' 

>>> d.name unique to d 

'Fido' 

>>> e.name # unique toe 
"Buddy ' 


正如 在 名 称 和 对 象 讨 论 的 ， 可 变 对 象 ， 例 如 列表 和 字典 ， 的 共享 数据 可 能 带 来 意外 的 效果 。 
例如 ， 下 面 代 码 中 的 tricks 列表 不 应 该 用 作 类 变量 ， 因 为 所 有 的 Dog 实例 将 共享 同一 个 列表 : 


class Dog: 
tricks = [] # mistaken use of a class variable 


def _ init (self, name): 
self.name - name 


def add trick(self, trick): 
self.tricks.append(trick) 


d - Dog('Fido') 
e = Dog('Buddy' ) 
>>> d.add_trick('roll over') 
e.add_trick('play dead') 
>>> d.tricks # unexpectedly shared by all dogs 
['roll over', 'play dead'] 


这 个 类 的 正确 设计 应 该 使 用 一 个 实例 变量 : 
class Dog: 
def _ init (self, name): 
self.name - name 


self.tricks - [] # creates a new empty list for each dog 


def add trick(self, trick): 
self.tricks.append(trick) 


>>> d = Dog('Fido') 
>>> e = Dog('Buddy') 
>>> d.add trick('roll over') 
>>> e.add trick('play dead') 


>>> d.tricks 
['roll over'] 
>>> e.tricks 
['play dead'] 


9.4. 补充 说 明 


数据 属性 会 覆盖 同名 的 方法 属性 ; 为 了 避免 意外 的 命名 冲突 ， 这 在 大 型 程序 中 可 能 带 来 极 难 
发 现 的 bug， 使 用 一 些 约定 来 减少 冲突 的 机 会 是 明智 的 。 可 能 的 约定 包括 大 写 方 法 名 称 的 首 
字母 ， 使 用 一 个 小 写 的 独特 字符 串 (也 许 只 是 一 个 下 划 线 ) 作为 数据 属性 名 称 的 前 级 ， 或 者 
方法 使 用 动词 而 数据 属性 使 用 名 词 。 


数据 属性 可 以 被 方法 引用 ， 也 可 以 由 一 个 对 象 的 普通 用 户 (“ 客 户 端 ") 使 用 。 换 句 话说 ， 类 是 
不 能 用 来 实现 纯 抽象 数据 类 型 。 事 实 上 ，Python 中 不 可 能 强制 隐藏 数据 一 一 那 全 部 基于 约 
Eo ( 另 一 方面 ， 如 果 需 要 ， 使 用 C 编写 的 Python 实现 可 以 完全 隐藏 实现 细节 并 控制 对 象 


的 访问 ; 这 可 以 用 来 通过 C 语言 扩展 Python。 ) 


客户 应 该 谨慎 的 使 用 数据 属性 一 一 客户 可 能 通过 践踏 他 们 的 数据 属性 而 使 那些 由 方法 维 扩 的 
常量 变 得 混乱 。 注 意 : 只 要 能 避免 冲突 ， 客 户 可 以 向 一 个 实例 对 象 添加 他 们 自己 的 数据 属 
性 ， TAEAE EATEN — ERE: 命名 约定 可 以 避免 很 多 麻烦 。 


从 方法 内 部 引用 数据 属性 (或 其 他 方法 ) 并 没有 快捷 方式 。 我 觉得 这 实际 上 增加 了 方法 的 可 
读 性 : 当 浏 览 一 个 方法 时 ， 在 局 部 变量 和 实例 变量 之 间 不 会 出 现 eme 


通常 ， 方 法 的 第 一 个 参数 称 为 self。 这 仅仅 是 一 个 约定 : 名 字 self 对 Python 而 言 绝 对 没有 任何 
特殊 含义 。 但 是 请 注意 : 如 果 不 遵 循 这 个 约定 ， 对 其 他 的 Python 程序 员 而 言 你 的 代码 可 读 性 
就 会 变 差 ， 而 且 有 些 类 查看 器 程序 也 可 能 是 遵循 此 约定 编写 的 。 


类 属性 的 任何 函数 对 象 都 为 那个 类 的 实例 定义 了 一 个 方法 。 辑 数 定义 代码 不 一 定 非得 定义 在 
类 中 : 也 可 以 将 一 个 画 数 对 象 赋值 给 类 中 的 一 个 局 部 变量 。 例 如 : 


# Function defined outside the class 
def fi(self, x, y): 
return min(x, x+y) 


class C: 
f = f1 
def g(self): 
return 'hello world' 
h = 9 


现在 fg 和 h 都 是 类 C 中 引用 画 数 对 象 的 属性 ， 因 此 它们 都 是 C 的 实例 的 方法 
于 g。 请 注意 ， 这 种 做 法 通常 只 会 混淆 程序 的 读者 。 


h 完 全 等 同 





通过 使 用 self 参 数 的 方法 属性 ， 方 法 可 以 调用 其 他 方法 : 


class Bag: 

def | init (self): 
self.data - [] 

def add(self, x): 
self.data.append(x) 

def addtwice(self, x): 
self.add(x) 
self.add(x) 


Jk n] ARS BHM IF Ren fip. SHRAKNS ME Fi OU X EGLI, 
(类 本 身 永远 不 会 做 为 全 局 作用 域 使 用 。) 尽管 很 少 有 好 的 理由 在 方法 中 使 用 全 局 数据 ， 全 
局 作用 域 确 有 很 多 合法 的 用 途 : 其 一 是 方法 可 以 调用 导入 全 局 作用 域 的 函数 和 模块 ， 也 可 以 
调用 定义 在 其 中 的 类 和 辑 数 。 通 常 ， 包 含 此 方法 的 类 也 会 定义 在 这 个 全 局 作用 域 ， 在 下 一 
我 们 会 了 解 为 何 一 个 方法 要 引用 自己 的 类 。 


每 个 值 都 是 一 个 对 象 ， 因 此 每 个 值 都 有 一 个 类 〈 也 称 为 类 型 ) 。 它 存储 为 object.class。 


9.5. 继承 
当然 ， 一 个 语言 特性 不 支持 继承 是 配 不 上 “类 ”这 个 名 字 的 。 派 生 类 定义 的 语法 如 下 所 示 : 


class DerivedClassName(BaseClassName): 
<statement -1> 


<statement -N> 


BaseClassName 必 须 与 派生 类 定义 在 一 个 作用 域内 。 用 其 他 任意 表达 式 代 替 基 类 的 名 称 也 是 
允许 的 。 这 可 以 是 有 用 的 ， 例 如 ， 当 基 类 定义 在 另 一 个 模块 中 时 : 


class DerivedClassName(modname.BaseClassName) : 


派生 类 定义 的 执行 过 程 和 基 类 是 相同 的 。 类 对 象 创 建 后 ， 基 类 会 被 保存 。 这 用 于 解析 属性 的 
引用 : 如 果 在 类 TAN 请 求 的 属性 ， 搜 索 会 在 基 类 中 继续 。 如 果 基 类 本 身 是 由 别 的 类 派生 
而 来 ， 这 个 规则 会 递归 应 用 。 


派生 类 的 实例 化 没有 什么 特殊 之 处 : DerivedClassName() 创 建 类 的 一 个 新 的 实例 。 方 法 的 引 
用 按 如 下 规则 解析 : 搜索 对 应 的 类 的 属性 ， 必 要 时 治 基 类 链 逐 级 搜索 ， 如 果 找 到 了 函数 对 象 
这 个 方法 引用 就 是 合法 的 。 


派生 的 类 可 能 重 写 其 基 类 的 方法 。 因 为 方法 调用 本 对 象 中 的 其 它 方法 时 没有 特权 ， 基 类 的 方 
法 调用 本 基 类 的 方法 时 ， 可 能 实际 上 最 终 调用 了 派生 类 中 的 覆盖 方法 。 (对 于 C++ 程序 员 : 
Python 中 的 所 有 方法 实际 上 都 是 虚 的 。) 


派生 类 中 的 覆盖 方法 可 能 是 想 要 扩充 而 不 是 简单 的 替代 基 类 中 的 重 名 方法 。 有 一 个 简单 的 方 

法 可 以 直接 调用 基 类 方法 : 只 要 调用 BaseClassName.methodname(self,arguments)。 有 时 这 
对 于 客户 端 也 很 有 用 。 (要 注意 只 有 BaseClassName 在 同一 全 局 作用 域 定义 或 导入 时 才能 这 
样 用 。) 


Python 有 两 个 用 于 继承 的 辑 数 : 


e 使 用 isinstance() 来 检查 实例 类 型 : isinstance(obj, int) 只 有 obj.class 是 int 或 者 是 从 int 派 生 
的 类 时 才 为 True。 

e 使 用 issubclass() 来 检查 类 的 继承 : issubclass(bool，int) 是 True 因为 bool 是 int 的 子 类 。 然 
而 ， issubclass (unicode，str) 是 False 因 为 unicode 不 是 str 的 一 个 子 类 (它们 只 是 共享 
一 个 共同 的 祖先 ， basestring) 。 


9.5.1. 多 继承 
Python 也 支持 一 定 限 度 的 多 继承 形式 。 具 有 多 个 基 类 的 类 定义 如 下 所 示 : 


class DerivedClassName(Basei1, Base2, Base3): 
«statement -1> 


«statement -N> 


对 于 旧 风 格 的 类 ， 唯 一 的 规则 是 深度 优先 ， 从 左 到 右 。 因 此 ， 如 果 在 DerivedClassName 中 找 
不 到 属性 ， 它 搜索 Base1， 然 后 (递归 ) 基 类 中 的 Base1， 只 有 没有 找到 ， 它 才 会 搜索 
base2， 依 此 类 推 。 


(对 某 些 人 ， 广 度 优先 一 一 在 搜索 Base1 的 基 类 之 前 先 搜索 base2 和 Base3 一 一 看 起 来 更 自 
然 。 然 而 ， 在 你 能 弄 明 白 与 base2 中 的 一 个 属性 名 称 冲突 的 后 果 之 前 ， 你 需要 知道 Base1 的 某 
个 特定 属性 实际 上 是 定义 在 Base1 的 还 是 在 其 某 个 基 类 中 的 。 深 度 优 先 规则 使 Base1 的 直接 属 
性 和 继承 的 属性 之 间 没 有 差别 ) 。 


对 于 新 风格 的 类 ， 方 法 的 解析 顺序 动态 变化 地 支持 合作 对 super() 的 调用 。 这 种 方法 在 某 些 其 
它 多 继承 的 语言 中 也 有 并 叫做 call-next-method， 它 比 单 继承 语言 中 的 super 调 用 更 强大 。 





对 于 新 风格 的 类 ， 动 态 调整 顺序 是 必要 的 ， 因 为 所 有 的 多 继承 都 会 有 一 个 或 多 个 蓉 形 关系 (从 
最 底部 的 类 向 上 ， 至 少 会 有 一 个 父 类 可 以 通过 多 条 路 径 访 问 到 ) 。 例 如 ， 所 有 新 风格 的 类 都 
继承 自 object， 所 以 任何 多 继承 都 会 有 多 条 路 径 到 达 object。 为 了 防止 基 类 被 重复 访问 ， 动 态 
算法 线性 化 搜索 顺序 ， 每 个 类 都 按 从 左 到 右 的 顺序 特别 指定 了 顺序 ， 每 个 父 类 只 调用 一 次 ， 
这 是 单调 的 (也 就 是 说 一 个 类 被 继承 时 不 会 影响 它 和 祖先 的 次 序 ) 。 所 有 这 些 特性 使 得 设计 可 
靠 并 且 可 扩展 的 多 继承 类 成 为 可 能 。 有 关 详 细 信 息 ， 请 参 

i] http://www.python.org/download/releases/2.3/mro/. 


9.6. 私有 变量 和 类 本 地 引用 


在 Python 中 不 存在 只 能 从 对 象 内 部 访问 的 “私有 "实例 变量 。 然 而 ， 有 一 项 大 多 数 Python ft 
码 都 遵循 的 公约 : 带 有 下 划 线 (例如 _spam) 前 级 的 名 称 应 被 视 为 非 公开 的 API 的 一 部 分 
(无 论 是 函数 、 方法 还 是 数据 成 员 ) 。 它 应 该 被 当做 一 个 实现 细节 ， 将 来 如 果 有 变化 识 不 另 
行 通知 。 

因为 有 一 个 合理 的 类 私有 成 员 的 使 用 场景 〈( 即 为 了 避免 名 称 与 子 类 定义 的 名 称 冲 突 ) ， 
Python 对 这 种 机 制 有 简单 的 支持 ， 叫 做 name mangling, spam 形式 的 任何 标识 符 (前 面 至 少 
两 个 下 划 线 ， 后 面 至 多 一 个 下 划 线 ) 将 被 替换 为 _classnamespam，classname 是 当前 类 的 名 
字 。 此 mangling 会 生效 而 不 考虑 该 标识 符 的 句法 位 置 ， 只 要 它 出 现在 类 的 定义 的 范围 内 。 


Name mangling 有 利于 子 类 重 写 父 类 的 方法 而 不 会 破坏 类 内 部 的 方法 调用 。 例 如 : 


class Mapping: 
def _ init__(self, iterable): 
self.items_list = [] 
self.__update(iterable) 


def update(self, iterable): 
for item in iterable: 
self.items_list.append(item) 


__update = update # private copy of original update() method 
class MappingSubclass(Mapping): 


def update(self, keys, values): 
# provides new signature for update() 
# but does not break __init__() 
for item in zip(keys, values): 
self.items_list.append(item) 


请 注意 mangling 规则 的 目的 主要 是 避免 发 生意 外 ; 访问 或 者 修改 私有 变量 仍然 是 可 能 的 。 这 
在 特殊 情况 下 ， 例 如 调试 的 时 候 ， 还 是 有 用 的 。 


请 注意 传递 给 exec、 eval() 或 execfile() 的 代码 没有 考虑 要 将 调用 类 的 类 名 当 作 当 前 类 ; 这 类 
似 于 global 语 名 的 效果 ， 影 响 只 限于 一 起 进行 字 节 编译 的 代码 。 相 同 的 限制 适用 于 getattr()、 
setattr() 和 delattr()， 以 及 直接 引用 dict 时 。 


9.7. 雪人 三 的 说 明 


有 时 候 类 似 于 Pascal 的 "record" 或 C 的 "struct" 的 数据 类 型 很 有 用 ， 它 们 把 几 个 已 命名 的 数据 
项 目 绑 定 在 一 起 。 一 个 空 的 类 定义 可 以 很 好 地 做 到 : 


class Employee: 
pass 


john = Employee() # Create an empty employee record 


# Fill the fields of the record 
john.name = 'John Doe' 
john.dept = ‘computer lab' 
john.salary = 1000 


某 一 段 Python 代码 需要 一 个 特殊 的 抽象 数据 结构 的 话 ， 通 常 可 以 传人 一 个 类 来 模拟 该 数据 类 
型 的 方法 。 例 如 ， 如 果 你 有 一 个 用 于 从 文件 对 象 中 格式 化 数据 的 画 数 ， 你 可 以 定义 一 个 带 有 

read () 和 readline () 方法 的 类 ， 以 此 从 字符 串 缓 冲 读 取 数 据 ， 然 后 将 该 类 的 对 象 作 为 参数 传人 
AU sh BATES 2T 


实例 的 方法 对 象 也 有 属性 : m.im_self 是 具有 方法 m() 的 实例 对 象 ，m.im_func 是 方法 的 函数 对 
象 。 


FL E? 
9.8. 寞 弟 也 是 类 


用 户 定 义 的 异常 类 也 由 类 标识 。 利 用 这 个 机 制 可 以 创建 可 扩展 的 异常 层次 。 
raise 语 句 有 两 种 新 的 有 效 的 (语义 上 的 ) 形式 : 


raise Class, instance 


raise instance 


第 一 种 形式 中 ，instance 必 须 是 class 或 者 它 的 子 类 的 实例 。 第 二 种 形式 是 一 种 简写 : 


raise instance. class instance 


——I 


except 子 句 中 的 类 如 果 与 异常 是 同一 个 类 或 者 是 其 基 类 ， 那 么 它们 就 是 相 容 的 (但 是 反 过 来 
是 不 行 的 一 一 except 子 句 列 出 的 子 类 与 基 类 是 不 相 容 的 ) 。 例 如 ， 下 面 的 代码 将 按 该 顺序 打 
AB. C. D: 


class B: 
pass 
class C(B): 
pass 
class D(C): 
pass 


for c in [B, C, D]: 


try: 
raise c() 
except D: 
print "Dp" 
except C: 
print "C" 
except B: 
print "B" 


请 注意 ， 如 果 except 子 句 的 顺序 倒 过 来 (excpet BB 在 最 前 面 ) ， 它 就 会 打印 B，B，B 一 
第 一 个 匹配 的 异常 被 触发 。 


打印 一 个 异常 类 的 错误 信息 时 ， 先 打印 类 名 ， 然 后 是 一 个 空格 、 一 个 冒号 ， 然 后 是 用 内 置 函 
数 str() 将 类 转换 得 到 的 完整 字符 串 。 


9.9. 迭代 器 


PUTER RI BEE SEAS A dao RAB LAA fondi 77 : 


for element in [1, 2, 3]: 
print element 

for element in (1, 2, 3): 
print element 

for key in {'one':1, 'two':2}: 
print key 

for char in "123": 
print char 

for line in open("myfile.txt"): 
print line, 


这 种 风格 的 访问 明确 、 简 法 和 方便 。 和 迭代 器 的 用 法 在 Python 中 普通 而 且 统 一 。 在 后 台 ， for 
语句 调用 容器 对 象 上 的 iter() 。 该 函数 返回 一 个 定义 了 next () 方 法 的 迭代 器 对 象 ， 它 在 容器 中 
逐一 访问 元 素 。 没 有 后 续 的 元 素 时 ， next () 会 引发 Stoplteration 异 常 ， 告 诉 for 循 环 终 止 。 此 
示例 显示 它 是 如 何 工作 : 


>>> s = 'abc' 

>>> it = iter(s) 

>>> it 

<iterator object at Ox00A1DB50> 
>>> it.next() 

tall 

>>> it.next() 

!b' 

>>> it.next() 


>>> it.next() 
Traceback (most recent call last): 
File "«stdin»", line 1, in ? 
it.next() 
StopIteration 


看 过 和 迭代 器 协议 背后 的 机 制 后 ， 将 很 容易 将 迭代 器 的 行为 添加 到 你 的 类 中 。 定 义 一 个 iter() 方 
法 ， 它 使 用 next() 方 法 返回 一 个 对 象 。 如 果 类 定义 了 next()，iter() 可 以 只 返回 self : 


class Reverse: 

"""Iterator for looping over a sequence backwards.""" 

def | init (self, data): 
self.data - data 
self.index - len(data) 

def _ iter (self): 
return self 

def next(self): 
if self.index -- 0: 

raise StopIteration 

self.index - self.index - 1 
return self.data[self.index] 


>>> rev = Reverse('spam' ) 

>>> iter(rev) 

<__main__.Reverse object at 0x00A1DB50» 
>>> for char in rev: 


print char 


0o mp 3s - 


9.10. 生成 器 


生成 器 是 创建 迭代 器 的 一 种 简单 而 强大 的 工具 。 它 们 写 起 来 就 像 是 正规 的 函数 ， 只 是 需要 返 
回 数据 的 时 候 使 用 yield 语 句 。 每 次 next() 调 用 时 ， 生 成 器 再 恢复 它 离开 的 位 置 ( 它 记 忆 语 句 最 
后 一 次 执行 的 位 置 和 所 有 的 数据 值 ) 。 以 下 示例 演示 了 生成 器 可 以 非常 简单 地 创建 出 来 : 


def reverse(data): 
for index in range(len(data)-1, -1, -1): 
yield data[index] 


>>> for char in reverse('golf'): 
print char 


Q Oore. 


生成 器 能 做 到 的 什么 事 ， 前 一 节 所 述 的 基于 类 的 迭代 器 也 能 做 到 。 生 成 器 这 么 紧凑 的 原因 是 
因为 iter() 和 next () 方 法 是 自动 创建 的 。 


另 一 个 关键 功能 是 调用 时 自动 保存 的 本 地 变量 和 执行 状态 。 这 使 得 该 函数 相 上 比 实例 变量 ， 如 
self.index 和 self.data 方 法 ， 更 容易 写 ， 更 清楚 地 使 用 。 


除了 自动 方法 创建 和 保存 的 程序 状态 外 ， 当 创建 完成 ， 他 们 会 自动 抛 出 Stoplteration。 组 合 起 
来 ， 这 些 功 能 可 以 容易 地 创建 迭代 器 如 同 编写 正规 阔 数 。 


9.11. 生成 器 表达 式 


使 用 类 似 列表 表 示 式 的 语法 ， 一 些 简单 的 生成 器 可 以 写成 简洁 的 表达 式 ， 但 是 使 用 圆 括号 代 
车 方 括号 。 这 些 表 达 式 用 于 生成 器 在 封闭 的 本 数 中 使 用 的 情况 。 生 成 器 表达 式 更 紧凑 但 没 
完整 的 生成 器 定义 用 途 广 泛 ， 比 等 同 的 列表 表示 式 消 耗 较 少 的 内 存 。 


例子 : 


>>> sum(i*i for i in range(10)) # sum of squares 


>>> xvec = [10, 20, 30] 
>>> yvec = [7, 5, 3] 
>>> sum(x*y for x,y in zip(xvec, yvec)) # dot product 


>>> from math import pi, sin 
>>> sine table = dict((x, sin(x*pi/180)) for x in range(0, 91)) 
>>> unique words = set(word for line in page for word in line.split()) 
>>> valedictorian = max((student.gpa, student.name) for student in graduates) 
>>> data = 'golf' 
>>> list(data[i] for i in range(len(data)-1, -1, -1)) 
[east a RE o 'g'] 
脚注 


| [1] | 有 一 件 事 除 外 。 模 块 对 象 具 有 一 个 隐藏 的 只 读 属性 叫做 dict， 它 返回 用 于 实现 模块 命名 
空间 的 字典 ; 名 称 dict 是 一 个 属性 而 不 是 一 个 全 局 的 名 称 。 很 明显 ， 使 用 它 违反 了 命名 空间 实 
现 的 抽象 ， 应 该 限制 在 类 似 事 后 调试 这 样 的 事情 上 。 | |-----|-----| 


10. 标准 库 概 览 
10.1. 操作 系统 接口 


os 模块 提供 了 几 十 个 画 数 与 操作 系统 交互 : 


>>> import os 

>>> os.getcwd() # Return the current working directory 

"C:\\Python26' 

>>> os.chdir('/server/accesslogs' ) # Change current working directory 
>>> os.system('mkdir today') # Run the command mkdir in the system shell 
0 
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数 ， 它 们 的 功能 完全 不 同 。 


内 置 的 dir() 和 help() 范 数 对 于 使 用 像 os 大 型 模块 可 以 作为 非常 有 用 的 交互 式 帮 助 : 


>>> import os 

>>> dir(os) 

<returns a list of all module functions> 

>>> help(os) 

<returns an extensive manual page created from the module's docstrings> 


对 于 日 常 的 文件 和 目录 管理 任务 ，shutil 模 块 提 供 了 一 个 易于 使 用 的 高 级 接口 : 


>>> import shutil 
>>> shutil.copyfile('data.db', 'archive.db') 
>>> shutil.move('/build/executables', 'installdir') 


10.2. 文件 通配符 
glob 模 块 提供 了 一 个 函数 用 于 在 目录 中 以 通配符 搜索 文件 ， 并 生成 匹配 的 文件 列表 : 


>>> import glob 
>>> glob.glob('*.py') 
['primes.py', 'random.py', 'quote.py'] 


10.3. 命令 行 参数 


常见 的 实用 程序 脚本 通常 需要 处 理 命 合 4 Be 这 些 参数 以 一 个 列表 存储 在 sys 模 块 的 argv 属 
性 中 。 例 如 下 面 的 输出 结果 来 自 于 从 命 爸 


行 运行 pythondemo.pyone two three : 


>>> import sys 
>>> print sys.argv 
['demo.py', 'one', 'two', 'three'] 


getopt 模 块 使 用 Unix getopt() AAI 27 = 438 sys.argv, argparse A Te HERA 更 灵活 的 
554517 ERE. 


10.4. 错误 输出 重 定 向 和 程序 终止 


sys 模 块 还 具有 stdin、stdout 和 和 stderr 属 性 。 即 使 在 stdout 被 重 定向 时 ， 后 者 也 可 以 用 于 显示 警 


告 和 错误 信息 : 


>>> sys.stderr.write('Warning, log file not found starting a new one\n') 
Warning, log file not found starting a new one 


终止 脚本 最 直接 的 方法 来 是 使 用 sys.exit()。 


10.5. 字符 串 模 式 匹配 


re 模块 为 高 级 的 字符 串 义理 提供 了 正则 表达 式 工具 。 对 于 复 末 的 匹配 和 操作 ， 正 则 表达 式 提供 
了 简洁 、 优 化 的 解决 方案 : 


>>> import re 

>>> re.findall(r'\bf[a-z]*', 'which foot or hand fell fastest') 
['foot', 'fell', 'fastest'] 

>>> re.sub(r'(Nb[a-z]*) \1', r'N1', 'cat in the the hat') 

'cat in the hat' 


当 只 需要 简单 的 功能 时 ， 最 好 使 用 字符 串 方 法 ， 因 为 它们 更 容易 阅读 和 调试 : 


>>> 'tea for too'.replace('too', 'two') 
"tea for two' 


10.6. 数学 
math 模 块 为 浮 点 运算 提供 了 对 底层 C RAUR RI» i : 


>>> import math 

>>> math.cos(math.pi / 4.0) 
0.70710678118654757 

>>> math.log(1024, 2) 

10.0 


random 模 块 提供 了 进行 随机 选择 的 工具 : 


>>> import random 

>>> random.choice(['apple', 'pear', 'banana']) 

'apple' 

>>> random.sample(xrange(100), 10) # sampling without replacement 
[30, 83, 16, 4, 8, 81, 41, 50, 18, 33] 


>>> random. random( ) # random float 

0.17970987693706186 

>>> random. randrange(6) # random integer chosen from range(6) 
4 


10.7. 互联 网 访问 


有 很 多 的 模块 用 于 访问 互联 网 和 义理 的 互联 网 协议 。 最 简单 的 两 个 是 从 URL 获 取 数 据 的 urllib2 
和 发 送 邮 件 的 smtplib : 


>>> import urllib2 
>>> for line in urllib2.urlopen('http://tycho.usno.navy.mil/cgi-bin/timer.pl'): 
if 'EST' in line or 'EDT' in line: # look for Eastern Time 
print line 


<BR>Nov. 25, 09:43:32 PM EST 


>>> import smtplib 

>>> server = smtplib.SMTP('localhost') 

>>> server.sendmail('soothsayer@example.org', 'jcaesar@example.org', 
. """To: jcaesar@example.org 
. From: soothsayerQexample.org 


. Beware the Ides of March. 


f uuu 


>>> server.quit() 
(请 注意 第 二 个 示例 需要 在 本 地 主机 上 和 运行 邮件 服务 器 ) 。 


10.8. 日 期 和 时 间 


datetime 模 块 提供 了 处 理 日 期 和 时 间 的 类 ， 娩 有 简单 的 方法 也 有 复杂 的 方法 。 支 持 日 期 和 时 间 
算法 的 同时 ， 实 现 的 重点 放 在 更 有 效 的 处 理 和 格式 化 输出 。 该 模块 还 支持 处 理 时 区 。 


>>> # dates are easily constructed and formatted 

>>> from datetime import date 

>>> now = date.today() 

>>> now 

datetime.date(2003, 12, 2) 

>>> now.strftime("%m-%d-%y. %d %b %Y is a 96A on the %d day of %B.") 
"12-02-03. 02 Dec 2003 is a Tuesday on the 02 day of December.' 


>>> # dates support calendar arithmetic 
>>> birthday = date(1964, 7, 31) 
>>> age = now - birthday 


>>> age.days 
14368 


10.9. 数据 压缩 
常见 的 数据 打包 和 压缩 格式 都 直接 支持 ， 这 些 模 块 包括 : zlib、gzip、bz2、zipfile 和 tarfile。 


>>> import zlib 


>>> s = 'witch which has which witches wrist watch' 
>>> len(s) 
41 


>>> t = zlib.compress(s) 

>>> len(t) 

37 

>>> zlib.decompress(t) 

"witch which has which witches wrist watch' 
>>> zlib.crc32(s) 

226805979 


10.10. 性 能 度量 


一 些 Python 用 户 对 同一 问题 的 不 同 解决 方法 之 间 的 性 能 差异 深 有 兴趣 。Python 提供 了 的 一 
个 度量 工具 可 以 立即 解决 这 些 问题 。 


例如 ， 使 用 元 组 封装 和 拆 封 功能 而 不 是 传统 的 方法 来 交换 参数 可 能 会 更 吸引 人 。timeit 模 块 快 
速 证 明了 现代 的 方法 更 快 一 些 : 


>>> from timeit import Timer 

>>> Timer('t=a; a=b; b=t', 'a=1; b=2').timeit() 
0.57535828626024577 

>>> Timer('a,b = b,a', 'a=1; b=2').timeit() 
0.54962537085770791 


与 timeit 的 精细 的 粒度 相反 ，profile 和 pstats 模 块 提供 了 针对 更 大 代码 块 的 时 间 度 量 工具 。 


10.11. 质量 控制 


开发 高 质量 软件 的 方法 之 一 是 为 每 一 个 画 数 开 发 测试 代码 ， 并 且 在 开发 过 程 中 经 常 进行 测 
IRo 


doctest& 3k de BE— I.E, HHRH HRT PARNAMMSR BAT. MRES 
剪 切 一 个 典型 的 调用 并 同 它 的 结果 粘贴 到 文档 字符 串 中 一 桩 简单 。 通 过 用 户 提供 的 例子 ， 它 
发 展 了 文档 ， 人 允许 doctest 模块 确认 代码 的 结果 是 否 与 文档 一 致 : 


def average(values): 
"""Computes the arithmetic mean of a list of numbers. 


>>> print average([20, 30, 70]) 
40.0 


return sum(values, 0.0) / len(values) 


import doctest 
doctest.testmod() # automatically validate the embedded tests 


unittest 模 块 不 像 doctest 模 块 那样 容易 ， 不 过 它 可 以 在 一 个 独立 的 文件 里 提供 一 个 更 全 面 的 测 
RE: 


import unittest 


class TestStatisticalFunctions(unittest.TestCase): 


def test_average(self): 
self .assertEqual(average([20, 30, 70]), 40.0) 
self .assertEqual(round(average([1, 5, 7]), 1), 4.3) 
with self.assertRaises(ZeroDivisionError): 
average([]) 
with self.assertRaises(TypeError): 
average(20, 30, 70) 


unittest.main() # Calling from the command line invokes all tests 


10.12. Batteries Included 


Python "Batteries Included" 的 哲学 。 这 最 好 是 通过 其 较 大 的 文件 包 的 先进 和 强大 功能 。 例 
如 : 


e Xmlrpclib 和 SimpleXMLRPCServer 模 块 让 远程 过 程 调用 变 得 轻而易举 。 尽 管 模块 有 这 样 
的 名 字 ， 它 不 需要 直接 XML 知识 或 处 理 XML 。 

e email 包 是 是 一 个 处 理 电 子 邮 件 的 库 ， 包 插 MIME 和 其 它 基 于 RFC 2822 的 邮件 。 与 smtplib 
和 poplib 用 于 实际 发 送 和 接收 邮件 ，email 包 有 一 个 完整 的 工具 集 用 于 构建 或 者 解码 复杂 


邮件 结构 (包括 附件 ) ， 并 实现 互联 网 编码 和 头 协议 。 

e xml.dom 和 xml.sax 的 包 为 这 种 流行 的 数据 交换 格式 提供 了 强大 的 支持 。 同 样 ，csv 模 块 支 
持 以 常见 的 数据 库 格式 直接 读 取 和 写 入 。 这 些 模 块 和 包 一 起 大 大 简化 了 Python 应 用 程序 
和 其 他 工具 之 间 的 数据 交换 。 

e 国际 化 支持 模块 包括 gettext、locale 和 codecs 包 。 


11. 标准 库 概 览 一 第 lI 部 分 


第 二 部 分 包含 了 更 高 级 的 模块 ， 它 们 支持 专业 编程 的 需要 。 这 些 模块 很 少 出 现在 小 型 的 脚本 
里 。 


11.1. 输出 格式 
repr 模 块 提供 的 repr() 的 自 定义 的 缩写 显示 大 型 或 深层 蔚 套 容器 的 版 本 : 


>>> import repr 
>>> repr.repr(set('supercalifragilisticexpialidocious')) 
"set(['a’', 5o "d te sp TO Da 


pprint 模 块 提供 更 复杂 的 打印 控制 ， 以 解释 器 可 读 的 方式 打印 出 内 置 对 象 和 用 户 定义 的 对 象 。 
当 结 果 超过 一 行 时 ， 这 个 "漂亮 的 打印 机 "将 添加 分 行 符 和 缩 进 ， 以 更 清楚 地 显示 数据 结构 : 


>>> import pprint 
>>> t = [[[['black', 'cyan'], 'white', ['green', 'red']], [['magenta', 
'yellow'], 'blue']]] 


>>> pprint.pprint(t, width=30) 
[L[E['black', 'cyan'], 
'white', 
['green', 'red']], 
[['magenta', 'yellow'], 
'blue']]] 


textwrap 模 块 格式 化 文本 段落 以 适应 设 定 的 屏 宽 : 


>>> Import textwrap 

>>> doc = """The wrap() method is just like fill() except that it returns 
. a list of strings instead of one big string with newlines to separate 
. the wrapped lines.""" 


>>> print textwrap.fill(doc, width=40) 
The wrap() method is just like fill() 
except that it returns a list of strings 
instead of one big string with newlines 
to separate the wrapped lines. 


locale 模 块 会 访问 区 域 性 特定 数据 格式 的 数据 库 。 分 组 属性 的 区 域 设 置 的 格式 函数 的 格式 设置 
的 数字 以 直接 的 方式 提供 了 组 分 隔 符 : 


>>> import locale 

>>> locale.setlocale(locale.LC_ALL, 'English_United States.1252') 
"English_United States.1252' 

>>> conv = locale.localeconv() # get a mapping of conventions 
>>> X = 1234567.8 

>>> locale.format("%d", x, grouping=True) 

'1,234,567' 

>>> locale.format_string("%s%.*f", (conv['currency symbol'], 

um conv['frac digits'], x), grouping-True) 
'$1,234, 567.80" 


11.2. 模板 


string 模 块 包括 一 个 通用 Template 类 ， 它 用 简化 的 语法 适合 最 终 用 户 编辑 。 这 人 允许 用 户 自 定义 
他 们 的 应 用 程序 无 需 修改 应 用 程序 。 


这 种 格式 使 用 的 占 位 符 名 称 由 $ 与 有 效 的 Python 标识 符 (字母 数字 字符 和 下 划 线 ) 组 成 。 周 
围 的 大 括号 与 占 位 符 人 允许 它 应 遵循 的 更 多 字母 数字 字母 并 且 中 间 没 有 空格 。$$ 创 建 一 个 转 义 
的 $ : 


>>> from string import Template 

>>> t = Template('${village}folk send $$10 to $cause.') 

>>> t.substitute(village-'Nottingham', cause='the ditch fund') 
'Nottinghamfolk send $10 to the ditch fund.' 


当 字 典 或 关键 字 参 数 中 没有 提供 占 位 符 时 ，substitute() 方 法 将 引发 KeyError。 对 于 邮件 -合并 
风格 的 应 用 程序 ， 用 户 提供 的 数据 可 能 不 完整 ， 这 时 safe_substitute() 方 法 可 能 会 更 合适 一 一 
如 果 没 有 数据 它 将 保持 占 位 符 不 变 : 


>>> t = Template('Return the $item to $owner.') 
>>> d = dict(item='unladen swallow' ) 

>>> t.substitute(d) 

Traceback (most recent call last): 


KeyError: 'owner' 
>>> t.safe_substitute(d) 


"Return the unladen swallow to $owner.' 


Template 类 的 子 类 可 以 指定 自 定义 的 分 隔 符 。 例 如 ， 图 像 浏览 器 的 批量 命名 工具 可 能 选用 百 
分 号 作为 表示 当前 日 期 、 图 像 序列 号 或 文件 格式 的 占 位 符 : 


>>> import time, os.path 
>>> photofiles = ['img 1074.jpg', 'img 1076.jpg', 'img 1077.jpg'] 
>>> class BatchRename(Template): 
delimiter = '%' 
>>> fmt = raw input('Enter rename style (%d-date %n-seqnum %f-format):  ') 
Enter rename style (%d-date %n-seqnum %f-format): Ashley_%n%f 


>>> t = BatchRename(fmt ) 

>>> date = time.strftime( '%d%b%y ' ) 

>>> for i, filename in enumerate(photofiles): 
base, ext = os.path.splitext(filename) 
newname = t.substitute(d-date, n-i, f=ext) 
print '{0} --> {1}'.format(filename, newname) 


img_1074.jpg --> Ashley_0.jpg 
img_1076.jpg --> Ashley_1.jpg 
img_1077.jpg --> Ashley_2.jpg 


模板 的 另 一 个 应 用 是 把 多 样 的 输出 格式 细节 从 程序 逻辑 中 分 类 出 来 。 这 使 它 能 够 替代 用 户 的 
XML 文件 、 纯 文 本 报告 和 HTML 网 页 报表 。 


11.3. 二 进 制 数据 记录 格式 


The struct module provides pack() and unpack() functions for working with variable length 
binary record formats. The following example shows how to loop through header information 
in a ZIP file without using the zipfile module. Pack codes "H" and "I" represent two and four 
byte unsigned numbers respectively. The "<" indicates that they are standard size and in 
little-endian byte order: 


import struct 


data = open('myfile.zip', 'rb').read() 

start = 0 

for i in range(3): # show the first 3 file headers 
start += 14 
fields = struct.unpack('«IIIHH', data[start:start+16]) 
crc32, comp size, uncomp_size, filenamesize, extra size = fields 


start *- 16 

filename = data[start:start+filenamesize] 

start += filenamesize 

extra = data[start:start+extra_size] 

print filename, hex(crc32), comp_size, uncomp_size 


start += extra_size + comp_size # skip to the next header 


11.4. 多 线程 
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度 ， 而 其 他 任务 同时 在 后 台 运 行 。 一 个 相关 的 使 用 场景 是 VO 操作 与 另 一 个 线程 中 的 计算 并 行 
执行 。 


下 面 的 代码 演示 在 主 程序 连续 运行 的 同时 ，threading 模 块 如 何在 后 台 运 行 任务 : 


import threading, zipfile 


class AsyncZip( threading. Thread): 

def | init (self, infile, outfile): 
threading.Thread. init (self) 
self.infile - infile 
self.outfile - outfile 

def run(self): 
f - zipfile.ZipFile(self.outfile, 'w', zipfile.ZIP DEFLATED) 
f.write(self.infile) 
f.close() 
print 'Finished background zip of: ', self.infile 


background = AsyncZip('mydata.txt', 'myarchive.zip') 
background.start() 
print 'The main program continues to run in foreground. ' 


background. join() # Wait for the background task to finish 
print 'Main program waited until background was done. ' 


多 线程 应 用 程序 的 最 主要 挑战 是 协调 线程 间 共 享 的 数据 或 其 他 资源 。 为 此 目的 ， 该 线程 模块 
提供 了 许多 同步 原 语 包括 锁 、 事件 、 条 件 变量 和 信号 量 。 


尽管 这 些 工具 很 强大 ， 很 小 的 设计 错误 也 可 能 导致 很 难 复 现 的 问题 。 因 此 ， 任 务 协调 的 首选 
方法 是 把 对 一 个 资源 的 所 有 访问 集中 在 一 个 单独 的 线程 中 ， 然 后 使 用 Queue 模 块 用 那个 线程 
服务 其 他 线程 的 请 求 。 应 用 程序 使 用 Queue.Queue 对 象 进 行 线程 间 的 通信 和 协调 将 更 容易 设 
i. 更 具 可 读 性 和 更 可 靠 。 


11.5. 日 志 


logging 模 块 提供 了 一 个 具有 完整 功能 并 且 非 常 灵活 的 日 志 系 统 。 最 简单 的 ， 发 送 消 息 到 一 个 
文件 或 者 sys.stderr : 


import logging 

logging.debug('Debugging information' ) 

logging.info('Informational message' ) 
logging.warning('Warning:config file %s not found', 'server.conf') 
logging.error('Error occurred') 

logging.critical('Critical error -- shutting down') 


这 将 生成 以 下 输出 : 


WARNING:root:Warning:config file server.conf not found 
ERROR:root:Error occurred 
CRITICAL:root:Critical error -- shutting down 


默认 情况 下 ， 信 息 和 调试 消息 被 压制 并 输出 到 标准 错误 。 其 他 输出 选项 包括 将 消息 通 
email, datagrams、sockets 发 送 ， 或 者 发 送 到 HTTP 服务 器 。 根 据 消息 的 优先 级 ， " ii 
as Lit IB X:DEBUG, INFO, WARNING, ERROR#ICRITICAL. 


志 系 统 可 以 直接 在 Python 代码 中 定制 ， 也 可 以 不 经 过 应 用 程序 直接 在 一 个 用 户 可 编辑 的 配 
E EN 
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Python 会 自动 进行 内 存 管 理 (对 大 多 数 的 对 象 进行 引用 计数 和 垃圾 回收 以 循环 利用 ) 。 在 最 
后 一 个 引用 消失 后 ， 内 存 会 立即 释放 。 


这 个 方式 对 大 多 数 应 用 程序 工作 良好 ， 但 是 有 时 候 会 需要 跟踪 对 象 ， 只 要 它们 还 被 其 它 地 方 
所 使 用 。 不 幸 的 是 ， 只 是 跟踪 它们 也 会 创建 一 个 引用 ， 这 将 使 它们 永久 保留 。weakref 模 块 提 
供 工 具 用 来 跟踪 对 象 而 无 需 创 建 一 个 引用 。 当 不 再 需要 该 对 象 时 ， 它 会 自动 从 weakref RH 
删除 并 且 会 为 weakref 对 象 触发 一 个 回调 。 典 型 的 应 用 包括 缓存 创建 的 时 候 需 要 很 大 开销 的 
对 象 : 


>>> import weakref, gc 
>>> class A: 
def | init (self, value): 
self.value - value 
def repr (self): 
return str(self.value) 


>>> a = A(10) # create a reference 

>>> d = weakref.weakValueDictionary() 

>>> d['primary'] =a # does not create a reference 

>>> d['primary'] # fetch the object if it is still alive 
10 

>>> dela # remove the one reference 

>>> gc.collect() # run garbage collection right away 

0 

>>> d['primary'] # entry was automatically removed 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
d['primary'] # entry was automatically removed 
File "C:/python26/lib/weakref.py", line 46, in  getitem _ 
o = self.data[key]() 
KeyError: 'primary' 


11.7. 列表 工具 


很 多 数据 结构 使 用 内 置 列表 类 型 就 可 以 满足 需求 。 然 而 ， 有 时 需要 其 它 具 有 不 同性 能 的 蔡 代 


The array module provides an array() object that is like a list that stores only homogeneous 
data and stores it more compactly. The following example shows an array of numbers stored 
as two byte unsigned binary numbers (typecode "H") rather than the usual 16 bytes per 
entry for regular lists of Python int objects: 


>>> from array import array 

>>> a = array('H', [4000, 10, 700, 22222]) 
>>> sum(a) 

26932 

>>> a[1:3] 

array('H', [10, 700]) 


collections 模 块 提供 了 一 个 deque() 对 象 ， 就 像 一 个 列表 ,不 过 它 从 左边 添加 和 弹出 更 快 ， 但 是 
在 内 部 查询 更 慢 。 这 些 对 象 非常 适合 实现 队列 和 广度 优先 的 树 搜索 : 


>>> from collections import deque 

>>> d = deque(["taski", "task2", "task3"]) 
>>> d.append("task4") 

>>> print "Handling", d.popleft() 

Handling task1 


unsearched = deque([starting node]) 
def breadth first search(unsearched): 
node = unsearched.popleft() 
for m in gen moves(node): 
if is goal(m): 
return m 
unsearched.append(m) 
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>>> import bisect 

>>> scores = [(100, 'perl'), (200, 'tcl'), (400, 'lua'), (500, 'python')] 
>>> bisect.insort(scores, (300, 'ruby')) 

>>> scores 

[(100, 'perl'), (200, 'tcl'), (300, 'ruby'), (400, 'lua'), (500, 'python')] 


heapq 模 块 提供 的 函数 可 以 实现 基于 常规 列表 的 堆 。 最 小 的 值 总 是 保持 在 第 需 个 位 置 。 这 对 循 
环 访问 最 小 元 素 ， 但 是 不 想 运行 完整 列表 排序 的 应 用 非常 有 用 : 


>>> from heapq import heapify, heappop, heappush 

>>> data = [1, 3, 5, 7, 9, 2, 4, 6, 8, 9] 

>>> heapify(data) # rearrange the list into heap order 
>>> heappush(data, -5) # add a new entry 

>>> [heappop(data) for i in range(3)] # fetch the three smallest entries 
[-5, 0, 1] 


11.8. 十 进 制 浮 点 数 运算 


decimal 模 块 提供 一 个 Decimal 数 据 类 型 用 于 为 十 进 制 浮 点 运算 。 相 比 二 进 制 浮 点 数 内 置 的 
float 实 现 ， 这 个 类 对 于 以 下 情形 特别 有 用 : 


e 财务 应 用 程序 和 其 他 用 途 ， 需 要 精确 的 十 进 制 表 示 形 式 ， 
控制 精度 ， 

对 符合 法 律 或 法 规 要 求 ， 舍 入 的 控制 

跟踪 有 效 小 数位 

e 用户 希望 计算 结果 与 手工 计算 相符 的 占用 程序 。 


例如 ， 计 算 上 70% 电 话费 的 5% 税 给 不 同 的 十 进 制 浮 点 和 二 进 制 浮 点 结果 。 区 别 变 得 重要 如 
果 结 果 舍 入 到 最 接近 的 分 : 


>>> from decimal import * 

>>> x = Decimal('0.70') * Decimal('1.05') 

>>> X 

Decimal('0.7350') 

>>> x.quantize(Decimal('0.01')) # round to nearest cent 
Decimal('0.74') 

>>> round(.70 * 1.05, 2) # same calculation with floats 
0.73 


Decimal 的 结果 总 是 保有 结尾 的 0， 自 动 从 两 位 精度 延伸 到 4 位 。Decimal 类 似 手 工 完成 的 数学 
运算 ， 这 就 避免 了 二 进 制 浮 点 数 无 法 精确 表达 数据 精度 产生 的 问题 。 


精确 地 表示 允许 Decimal 可 以 执行 二 进 制 浮 点 数 无 法 进行 的 模 运 算 和 等 值 测 试 : 


>>> Decimal('1.00') % Decimal('.10') 
Decimal('0.00') 

>>> 1.00 % 0.10 

0.09999999999999995 


>>> sum([Decimal('0.1')]*10) == Decimal('1.0') 
True 

>>> sum([0.1]*10) == 1.0 

False 


decimal 模 块 提供 任意 精度 的 运算 : 


>>> getcontext().prec = 36 
>>> Decimal(1) / Decimal(7) 
Decimal('0.142857142857142857142857142857142857') 


12. 现 在 怎么 办 ? 


阅读 本 教程 可 能 让 你 对 使 用 Python 更 感 兴趣 了 
问题 。 你 应 该 到 哪里 去 了 解 更 多 Python 的 内 容 呢 ? 


你 应 该 会 渴望 将 Python 应 用 于 解决 实际 





本 教程 是 Python 文档 集 的 一 部 分 。 文 档 集 中 的 一 些 其 它 文件 有 : 
e Python 标准 库 : 


你 应 该 浏览 本 手册 ， 它 给 出 了 标准 库 中 关于 类 型 、 本 数 和 模块 的 完整 〈《 虽 然 简 洁 ) 的 参考 资 
料 。 标 准 的 Python 发 布 包含 大 量 的 附加 模块 。 其 中 有 读 取 Unix 邮箱 、 收 取 HTTP 文档 、 生 
成 随机 数 、 解 析 命令 行 选 项 、 编 写 CGI 程序 、 压 缩 数 据 以 及 很 多 其 它 任 务 的 模块 。 浏 览 一 下 
这 个 库 参 考 手册 会 让 你 知道 有 什么 是 现成 可 用 的 。 


e 安装 Python 模块 解释 如 何 安装 由 其 他 Python 用 户 编写 的 外 部 模块 。 


e Python 语言 参考 : 详细 地 讲述 了 Python 的 语法 和 语义 。 它 读 起 来 很 难 ， 但 是 作为 语言 
本 身 的 完整 指南 非常 有 用 。 


更 多 的 Python 资源 : 


e http://www.python.org : 主要 的 Python Web 站 点 。 它 包含 代码 、 文 档 和 网 上 Python 相 
关 页 面 的 链接 。 该 网 站 在 世界 各 地 都 有 镜像 ， 如 欧洲 、 日 本 和 澳大利亚 ; 镜像 可 能 会 比 
主 站 快 ， 这 取决 于 你 的 地 理 位 置 。 

e http://docs.python.org : 快速 访问 Python 的 文档 。 

e http://pypi.python.org: Python 包 素 引 ， 以 前 的 绰号 叫 奶 酷 店 ， 是 用 户 创 建 的 Python 模 
块 的 索引 ， 这 些 模块 可 供 下 载 。 一 旦 你 开始 发 布 代码 ， 你 可 以 在 这 里 注册 你 的 代码 这 样 
其 他 人 可 以 找到 它 。 

e http://aspn.activestate.com/ASPN/Python/Cookbook/: 这 本 Python 食谱 收集 了 相当 多 的 
代码 示例 、 大 型 的 模块 ， 以 及 有 用 的 脚本 。 其 中 尤其 显著 的 贡献 被 收集 成 一 书 ， 这 本 书 
也 叫做 Python Cookbook (O'Reilly & Associates, ISBN 0-596-00797-3)。 


Python 相关 的 问题 和 问题 报告 ， 你 可 以 发 布 到 新 闻 组 comp.lang.python， 或 将 它们 发 送 到 邮 
件 列表 python-list@python. 组 织 结构 图 。 新 闻 组 和 邮件 列表 是 互通 的 ， 因 此 发 布 到 其 中 的 一 个 
消息 将 自动 转发 给 另外 一 个 。 一 天 大 约 有 120 个 帖子 (最 高 峰 到 好 几 百 )， 包 括 询问 (AG 
答 ) 问题 ， 建 议 新 的 功能 和 宣布 新 的 模块 。 在 发 帖 之 前 ， 一 定 要 检查 常见 问题 (也 称 为 
FAQ) 的 列表 。 可 在 http://mail.python.org/pipermail/ 查 看 邮件 列表 的 为 档 。FAQ 回答 了 很 多 
经 常 出 现 的 问题 ， 可 能 已 经 包含 你 的 问题 的 解决 方法 。 


13. 交互 式 输 入 的 编辑 和 历史 记录 


某 些 版 本 的 Python 解释 器 支持 编辑 当前 的 输入 行 和 历史 记录 ， 类 似 于 在 Korn shell 和 GNU 
Bash shell 中 看 到 的 功能 。 这 是 使 用 GNU Readline 库 实现 的 ， 它 支持 Emacs 风格 和 vi 风格 
的 编辑 。 这 个 库 有 它 自己 的 文档 ， 在 这 里 我 不 就 重复 了 ; 然而 ， 基 本 原理 很 容易 解释 。 本 章 
讲述 的 交互 式 编辑 和 历史 记录 功能 在 Unix 版 本 和 Cygwin 版 本 中 是 可 选 的 。 


本 章 不 是 Mark Hammond 的 PythonWin 包 或 者 随 Python 一 起 发 布 的 基于 TK 的 IDLE 环境 
的 文档 。 基 于 NT 系统 的 DOS 和 其 它 DOS, Windows 系统 上 的 命令 行 历史 回溯 是 另 一 个 话 


题 。 


13.1. 行 编辑 


如 果 支 持 ， 无 论 解释 器 打印 主 提 示 符 还 是 从 属 提示 符 ， 输 入 行 一 直 都 可 以 编辑 。 可 以 使 用 传 
统 的 Emacs 控制 字符 编辑 当前 行 。 其 中 最 重要 的 是 : C-A (Control-A) 将 光标 移动 到 行 首 ，C-E 
移 到 行 尾 ，C-B 将 光标 向 左 移动 一 个 位 置 ，C-F 向 右 移动 一 个 位 置 。 退 格 键 删除 光标 左 侧 的 字 
符 ，C-D 删 除 光 标 右 侧 的 字符 。C-k 删 掉 一 行 中 光标 右 侧 的 所 有 字符 ，C-y 将 最 后 一 次 删除 的 字 
符 串 粘贴 到 光标 位 置 。C- 下 划 线 将 撤消 最 近 一 次 的 更 改 ; 它 可 以 重复 执行 并 产生 累积 效果 。 


13.2. 历史 记录 


历史 记录 的 工作 方式 如 下 。 所 有 的 非 空 输入 行 都 保存 在 历史 记录 缓冲 区 中 ， 当 给 出 一 个 新 的 
提示 符 时 ， 你 位 于 缓冲 区 最 底部 新 的 一 行 。C-P 向 上 (fll) 移动 历史 记录 缓冲 区 中 的 一 行 ， 
C-N 向 下 移动 一 行 。 历 史记 录 缓 冲 区 中 的 任何 一 行 都 可 以 编辑 ; 提示 符 的 前 面 用 一 个 星 号 标记 
修改 的 行 。 按 Return 键 会 特 当前 行 传递 给 解释 器 。C-R 开 始 逐 渐 向 后 搜索 ; C-S 开 始 向 前 搜 
Fo 


13.3. 快捷 键 绑 定 


通过 将 命令 放 在 一 个 名 为 ~/.inputrc 的 初始 化 文件 中 ， 可 以 自 定义 快捷 键 和 Readline 库 的 一 些 
其 他 参数 。 快 捷 键 绑 定 有 如 下 方式 


key-name: function-name 


x 
oa 


"string": function-name 


也 可 以 设置 选项 


set option-name value 


例如 : 


# I prefer vi-style editing: 
set editing-mode vi 


# Edit using a single line: 
set horizontal-scroll-mode On 


# Rebind some keys: 

Meta-h: backward-kill-word 
"\C-u": universal-argument 
"\C-x\C-r": re-read-init-file 


注意 Python 中 Tab 键 默认 绑 定 的 是 插入 一 个 制 表 符 而 不 是 Readline 的 默认 文件 名 补 全 功能 。 
如 果 你 坚持 这 样 做 ， 你 可 以 放置 一 行 


Tab: complete 


在 你 的 ~/.inputrc 中 。 (当然 ， 如 果 你 习惯 使 用 Tab 作 为 缩 进 ， 这 会 使 得 输入 续 行 的 缩 进 很 困 
难 。) 


可 以 选择 变量 和 模块 名 自动 补 全 功能 。 若 要 在 解释 器 的 交互 模式 中 启用 这 个 功能 ， 添 加 以 下 
内 容 到 你 的 启动 文件 [1] 


import rlcompleter, readline 
readline.parse and bind('tab: complete') 


这 将 Tab 键 绑 定 到 补 全 功能 ， 所 以 按 Tab 键 两 次 将 会 给 出 补 全 的 建议 ; 它 会 查找 Python 语句 名 
称 、 当 前 的 局 部 变量 以 及 有 效 的 模块 名 。 例 如 点 分 表达 式 string.a， 它 会 先 解析 最 后 一 个 点 … 之 
前 的 表达 式 ， 然 后 根据 结果 对 象 给 出 建议 补 全 的 内 容 。 注 意 如 果 表 达 式 得 到 的 对 象 带 

有 getattr() 方 法 ， 这 可 能 会 执行 应 用 程序 定义 的 代码 。 


更 有 用 的 启动 文件 可 能 看 起 来 像 下 面 这 个 示例 。 注 意 下 面 的 示例 删除 了 它 创建 的 名 称 ， 一 旦 
这 些 名 称 不 再 需要 ; 这 是 因为 启动 文件 与 交互 式 命令 在 相同 的 命名 空间 中 执行 ， 删 除 这 些 名 
称 可 以 避免 在 交互 式 环境 中 产生 副作用 。 你 可 能 发 现 保留 一 些 导 和 人 的 模块 有 时 也 会 很 方便 ， 
例如 os， 因 为 在 大 多 数 与 解释 器 的 交互 中 都 需要 它 。 


Add auto-completion and a stored history file of commands to your Python 
interactive interpreter. Requires Python 2.0+, readline. Autocomplete is 
bound to the Esc key by default (you can change it - see readline docs). 


Store the file in ~/.pystartup, and set an environment variable to point 
to it: "export PYTHONSTARTUP=~/.pystartup" in bash. 


import atexit 
import os 

import readline 
import rlcompleter 


historyPath - os.path.expanduser("-/.pyhistory") 
def save history(historyPath-historyPath): 
import readline 


readline.write history file(historyPath) 


if os.path.exists(historyPath): 
readline.read history file(historyPath) 


atexit.register(save history) 
del os, atexit, readline, rlcompleter, save history, historyPath 


13.4. 其 它 交 互 式 解释 器 


与 早期 版 本 的 解释 器 相 比 ， 现 在 是 向 前 巨大 的 进步 ; 然而 ， 有 些 愿 望 还 是 没有 实现 : 如 果 能 
对 连续 的 行 给 出 正确 的 建议 就 更 好 了 (解析 器 知道 下 一 行 是 否 需要 缩 进 ) 。 补 全 机 制 可 以 使 
用 解释 器 的 符号 表 。 检 查 《或 者 只 是 建议 ) 匹配 的 括号 、 引号 的 命令 等 也 会 非常 有 用 。 


一 个 增强 的 交互 式 解释 器 是 IPython， 它 已 经 存在 相当 一 段 时 间 ， 具 有 tab 补 全 、 wR 
exploration 和 高 级 的 历史 记录 功能 。 它 也 可 以 彻底 定制 并 铭 入 到 其 他 点 用 程序 中 。 另 一 个 类 
似 的 增强 的 交互 式 环境 是 bpython。 

脚注 


L1] 当 你 启动 一 个 交互 式 解释 器 时 ，Python 将 执行 环境 变量 PYTHONSTARTUP 指 定 的 文件 
中 的 内 容 。 若 还 要 定制 化 非 交 互 式 的 Python， 请 参阅 定制 化 模块 。 | |-----|-----| 


4. 浮 点 数 运算 : 问题 和 局 限 
浮 点 数 在 计算 机 硬件 中 表示 为 以 2 AE 二进制) 的 小 数 。 例 如 ， 十 进 制 小 数 


0.125 


1/10 + 2/100 + 5/1000 的 值 ， 同 样 二 进 制 小 数 


0.001 


是 0/2 + 0/4 + 1/8 的 值 。 这 两 个 小 数 具 有 相同 的 值 ， 唯 一 真正 的 区 别 是 ， 第 一 个 小 数 是 十 进 
制 表 示 法 ， 第 二 个 是 二 进 制 表 示 法 。 


不 幸 的 是 ， 大 多 数 十 进 制 小 数 不 能 完全 用 二 进 制 小 数 表 示 。 结 果 是 ， 一 般 情况 下 ， 你 输入 的 
十 进 制 浮 点 数 仅 由 实际 存储 在 计算 机 中 的 近似 的 二 进 制 浮 点 数 表示 。 


这 个 问题 在 十 进 制 情况 下 很 容易 理解 。 考 虑 分 数 113， 你 可 以 用 十 进 制 小 数 近 似 它 : 


0.3 
或 者 更 接近 的 
0.33 


或 者 再 接近 一 点 的 


0.333 


等 等 。 无 论 你 愿意 写 多 少 位 数字 ， 结 果 永 远 不 会 是 精确 的 1/3， 但 将 会 越 来 越 好 地 逼近 1/3, 


同样 地 ， 无 论 你 使 用 多 少 位 的 二 进 制 数 ， 都 无 法 确切 地 表示 十 进 制 值 0.1。1/10 用 二 进 制 表示 
是 一 个 无 限 循环 的 小 数 。 


0.0001100110011001100110011001100110011001100110011... 


在 任何 有 限 数量 的 位 停 下 来 ， 你 得 到 的 都 是 近似 值 。 


在 一 台 运 行 Python id 由 型 机 器 上 , Python 浮 点 数 具 有 53 位 的 精度 ， 所 以 你 输入 的 十 进 制 数 
0.1 存 储 在 内 部 的 是 二 进 制 小 数 


0.00011001100110011001100110011001100110011001100110011010 


非常 接近 ， 但 不 完全 等 于 1/10, 


由 于 解释 器 显示 浮 点 数 的 方式 ， 很 容易 忘记 存储 在 计算 机 中 的 值 是 原始 的 十 进 制 小 数 的 近 
似 。Python 只 打印 机 器 中 存储 的 二 进 制 值 的 十 进 制 近似 值 。 如 果 Python 要 打印 0.1 存储 的 
二 进 制 的 真正 近似 值 ， 将 会 显示 


>>> 0.1 
0.1000000000000000055511151231257827021181583404541015625 


这 么 多 位 的 数字 对 大 多 数 人 是 没有 用 的 ， 所 以 Python 显示 一 个 舍 入 的 值 


>>> 0.1 


意识 到 在 真正 意义 上 这 是 一 种 错觉 是 很 重要 的 : 机 器 中 的 值 不 是 精确 的 1110， 它 显示 的 只 是 
机 器 中 真实 值 的 舍 入 。 一 旦 你 用 下 面 的 数值 进行 算术 运算 ， 这 个 事实 就 变 得 很 明显 了 


>>> 0.1 + 0.2 
0.30000000000000004 


注意 ， 这 是 二 进 制 浮 点 数 的 自然 性 质 : 它 不 是 Python 中 的 一 个 bug ， 也 不 是 你 的 代码 中 的 
bug。 你 会 看 到 所 有 支持 硬件 浮 点 数 算法 的 语言 都 会 有 这 个 现象 (尽管 有 些 语言 默认 情况 下 或 
者 在 所 有 输出 模式 下 可 能 不 会 显示 出 差异 ) 。 


还 有 其 它 意 想不到 的 。 例 如 ， 如 果 你 舍 入 2.675 到 两 位 小 数 ， 你 得 到 的 是 


>>> round(2.675, 2) 
2.67 


内 置 round() 函 数 的 文档 说 它 舍 入 到 最 接近 的 值 ，rounding ties away from zero。 因 为 小 数 
2.675 正好 是 2.67 和 2.68 的 中 间 ， 你 可 能 期 望 这 里 的 结果 是 (二进制 近似 为 ) 2.68。 但 是 不 
是 的 ， 因 为 当 十 进 制 字 符 串 2.675 转 换 为 一 个 二 进 制 浮 点 数 时 ， 它 仍然 被 蔡 换 为 一 个 二 进 制 的 
近似 值 ， 其 确切 的 值 是 


2.67499999999999982236431605997495353221893310546875 


因为 这 个 近似 值 稍微 接近 2.67 而 不 是 2.68， 所 以 向 下 舍 入 。 


如 果 你 的 情况 需要 考虑 十 进 制 的 中 位 数 是 如 何 被 舍 入 的 ， 你 应 该 考虑 使 用 decimal 模 块 。 顺 便 
说 一 下 ，decimal 模 块 还 提供 了 很 好 的 方式 可 以 “看 到 ”任何 Python 浮 点 数 的 精确 值 。 


>>> from decimal import Decimal 
>>> Decimal(2.675) 
Decimal ( '2.67499999999999982236431605997495353221893310546875' ) 


另 一 个 结果 是 ， 因 为 0.1 不 是 精确 的 110， 十 个 值 为 0.1 数 相 加 可 能 也 不 会 正好 是 1.0 : 


>>> sum = 0.0 

>>> for i in range(10): 
sum += 0.1 

>>> sum 

0.9999999999999999 


二 进 制 浮 点 数 计 算 有 很 多 这 样 意 想 不 到 的 结果 。 "0. 人 的 问题 在 下 面 "误差 的 表示 "一 节 中 有 准确 
详细 的 解释 。 更 完整 的 常见 怪异 现象 请 人 参见 浮 点 数 的 危险 。 


最 后 我 要 说 ， "没有 简单 的 答案 "。 也 不 要 过 分 小 心 浮 点 数 ! Python 浮 点 数 计算 中 的 误差 源 之 
于 浮 点 数 硬件 ， 大 多 数 机 器 上 每 次 计算 误差 不 2**53 分 之 一 。 对 于 大 多 数 任务 这 已 经 足 
够 了 ， 但 是 你 要 在 心中 记 住 这 不 是 十 进 制 算法 ， 每 个 浮 点 数 计算 可 能 会 带 来 一 个 新 的 舍 入 错 
误 。 

虽然 确实 有 问题 存在 ， 对 于 大 多 数 平常 的 浮 点 数 运算 ， 你 只 要 简单 地 将 最 终 显示 的 结果 舍 人 
到 你 期 望 的 十 进 制 位 数 ， 你 就 会 得 到 你 期 望 的 最 终结 果 。 关 于 如 何 精确 控制 浮 点 数 的 显示 请 
参阅 格式 化 字符 串 的 语法 中 strformat() 方 法 的 格式 说 明 符 。 


14.1. — zt iA RE 


这 一 节 将 详细 解释 "0.1” 那 个 示例 ， 并 向 你 演示 对 于 类 似 的 情况 自己 如 何 做 一 个 精确 的 分 析 。 
假设 你 已 经 基本 了 解 浮 点 数 的 二 进 制 表示 。 


二 进 制 表 示 的 误差 指 的 是 这 一 事实 ， 一 些 (实际 上 是 大 多 数 ) 十 进 制 小 数 不 能 精确 地 用 二 进 制 
小 数 表示 。 这 是 为 什么 Python (A Perl C. C++, Java, Fortran 和 其 他 许多 语言 ) iB 
常 不 会 显示 你 期 望 的 精确 的 十 进 制 数 的 主要 原因 : 


>>> 0.1 + 0.2 
0.30000000000000004 


这 是 为 什么 ?1/10 和 2/10 不 能 用 二 进 制 小 数 精确 表示 。 今 天 (2010 年 7 A) 几乎 所 有 的 机 
器 都 使 用 IEEE-754 浮 点 数 算法 ， 几 乎 所 有 的 平台 都 将 Python 的 浮 点 数 映 射 成 IEEE-754"“ 双 
精度 浮 点 数 "。754 双 精 度 浮 点 数 包 含 53 位 的 精度 ， 所 以 输入 时 计算 机 努力 将 0.1 转换 为 最 接 


近 的 J/2 *N 形式 的 小 数 ， 其 中 J 是 一 个 53 位 的 整数 。 改 写 


1 / 10 ~= J / (2**N) 


A 


J ~= 2**N / 10 


回想 一 下 J 有 53 位 (>=252(8<253) ， 所 以 N 的 最 佳 值 是 56 : 


>>> 2**52 
4503599627370496 
>>> 2**53 
9007199254740992 
>>> 2**56/10 
7205759403792793 


Bl 56 是 入 保证 J 具有 53 位 精度 的 唯一 可 能 的 值 。J 可 能 的 最 佳 值 是 商 的 舍 入 : 


>>> q, r = divmod(2**56, 10) 
>>> 1 
6 


由 于 余数 大 于 10 的 一 半 ， 最 佳 的 近似 值 是 向 上 舍 入 : 


>>> q+1 
7205759403792794 


因此 在 754 双 精 度 下 1/10 的 最 佳 近似 是 J 取 大 于 2**56 的 那个 数 ， 即 


7205759403792794 / 72057594037927936 


请 注意 由 于 我 们 向 上 舍 入 ， 这 其 实 有 点 大 于 1/10; 如 果 我 们 没有 向 上 舍 入 ， 商 数 就 会 有 点 小 
于 1/10。 但 在 任何 情况 下 它 都 不 可 能 是 精确 的 1/10! 


所 以 计算 机 从 来 没有 "看 到 "1/10 : 它 看 到 的 是 上 面 给 出 的 精确 的 小 数 ，754 双 精 度 下 可 以 获得 
的 最 佳 的 近似 了 : 


225] 256 
7205759403792794.0 


如 果 我 们 把 这 小 数 乘 以 10*30， 我 们 可 以 看 到 其 (截断 后 的 ) 值 的 最 大 30 位 的 十 进 制 数 : 


>>> 7205759403792794 * 10**30 // 2**56 
100000000000000005551115123125L 


也 就 是 说 存储 在 计算 机 中 的 精确 数字 约 等 于 十 进 制 什 
0.100000000000000005551115123125。 以 前 Python 2.7 和 Python 3.1 版 本 中 ，Python 四 
舍 五 入 到 17 个 有 效 位 ， 给 出 的 值 是 '0.10000000000000001'。 在 当前 版 本 中 ，Python 显示 
一 个 最 短 的 十 进 制 小 数 ， 它 会 正确 舍 入 真实 的 二 进 制 值 ， 结 果 就 是 简单 的 '0.1'。 


Python 2 标准 库 


忆 y 妨 on 语言 参考 讲述 Python 语言 准确 的 语法 和 语义 ， 而 该 库 参 考 手册 讲述 与 Python 一 起 发 布 
的 标准 库 。 它 还 讲述 在 Python 发 布 中 某 些 常见 的 可 选 组 件 。 


Python 的 标准 库 非 常 广泛 ， 它 们 提供 范围 很 广 的 工具 ， 下 面 列 出 的 长 长 的 目录 可 以 表明 。 这 
个 库 包含 提供 访问 系统 功能 的 内 建 模块 〈 以 C 语 言 编写 ) ， 例 如 文件 /DOD， 否 则 其 对 于 Python 
程序 员 将 是 无 法 访问 的 ， 同 时 它 还 包含 Python 语言 编写 的 模块 ， 可 为 日 常 编程 出 现 的 许多 问 
题 提 供 标准 化 的 方案 。 其 中 某 些 模块 明确 地 为 鼓励 和 增强 Python 程序 的 可 移植 性 而 设计 ， 通 
过 将 平台 相关 抽象 成 平台 无 关 的 API。 

Windows 平 台 上 的 Python 安装 程序 通常 包含 完整 的 标准 库 并 经 常 包含 很 多 领 外 的 组 件 。 对 于 
Unix 类 操作 系统 ，Python 通 常 以 一 组 包 提 供 ， 所 以 可 能 需要 使 用 操作 系统 提供 的 包 管 理工 具 
来 获取 部 分 或 者 所 有 的 可 选 组 件 。 

除 该 标准 库 之 外 ， 还 有 正在 不 断 增 长 的 几 千 个 组 件 〈 从 单个 程序 和 模块 到 包 以 及 完整 的 应 用 
程序 开发 框架 ) 可 以 从 Python 包 索引 获得 。 


1. 引言 
“Python 标准 库 " 包 含 几 个 不 同类 型 的 组 件 。 


如 数字 和 列表 ， 一 般 被 认为 是 编程 语言 的 核心 数据 类 型 。 对 这 些 类 型 ， Python 语言 内 核 XE 
LT 简单 的 形式 ， 对 其 语法 作 了 一 些 约束 ， 但 不 是 完全 定义 它们 的 语法 。( 另 一 方面 ， 语 言 核 
心 的 确定 义 了 一 些 语法 特性 ， 如 操作 符 的 拼写 和 优先 级 .) 


标准 库 还 包括 内 置 的 范 数 和 表达 式 。 即 那些 可 以 被 直接 使 用 ， 而 不 需要 import 语句 另外 导入 
的 对 象 。 其 中 一 些 被 核心 语言 定义 ， 但 大 部 分 对 核心 语法 而 言 并 不 是 必须 的 ， 只 是 在 这 里 介 
绍 一 下 。 


其 实 大 量 的 库 集合 在 一 起 组 成 了 一 些 模 块 。 可 以 从 许多 不 同 的 角度 来 剖析 这 些 集合 。 一 些 模 
块 用 C 写 成 ， 内 置 在 Python 解 释 器 中 。 其 他 的 模块 就 是 Python 写 的 ， 以 Python 源 码 的 形式 导 
入 。 一 些 模块 提供 的 是 针对 Python 的 接口 ， 如 打印 一 个 堆栈 的 信息 。 一 些 模块 是 针对 特定 的 
操作 系统 ， 像 连接 特定 的 硬件 的 。 还 有 一 些 模块 是 针对 特定 应 用 领域 的 ， 如 互联 网 。 许 多 的 
模块 在 全 部 的 Python 版 本 和 端口 中 都 可 以 使 用 。 而 另外 一 些 只 有 在 系统 支持 和 需要 的 情况 下 
才 可 以 使 用 。 还 有 一 些 需 要 在 编译 和 安装 Python 的 时 候 配置 了 相应 的 选项 才 可 以 使 用 。 


这 个 手册 以 “由 内 而 外 ”的 方式 组 织 : 它 首 先 介 绍 了 内 置 的 数据 类 型 ， 然 后 内 置 的 男 数 和 表达 
式 ， 最 后 是 按照 相关 性 组 织 把 模块 组 织 成 一 "TEM 节 的 顺序 是 按照 章节 中 的 模块 大 致 从 
常用 到 不 那么 重要 来 排列 的 。 


这 意味 着 ， 你 可 以 从 头 读 这 个 手册 ， 当 你 烦 了 的 时 候 就 跳 到 下 一 章 ， 这 样 对 于 Python 标 准 库 
en ae ea i 一 个 大 概 了 解 。 当 然 ， 也 不 用 像 读 小 说 地 一 样 读 

， 你 可 以 先 看 看 目录 〈 在 手册 最 前 面 ) ， 寻 找 特定 的 函数 ， 模 块 ， 或 者 在 搜索 框 (在 后 
ee 下 。 最 后 ， 如 果 你 享受 随机 选择 一 个 主题 去 阅读 的 方式 ， 你 可 以 先 选 择 一 个 
随机 页 码 ， 读 上 一 两 段 。 无 论 你 想 怎 么 读 ， 还 是 建议 从 内 和 置 画 数 这 一 章 开 始 读 ， 原 因 是 其 
他 的 章节 都 是 在 假设 你 已 经 了 解 ABM 这 一 章 的 基础 上 介绍 的 。 


让 我 们 开始 吧 ! 


SEES II aval =a iava o io or A) 1 
Python HX EBA X f 2.7 & 3.4 


T . a O.^ 


2. AER 
Python 解释 器 内 置 了 一 些 函 数 ， 它 们 总 是 可 用 。 这 里 将 它们 按 字母 顺序 列 出 。 


Built-in Functions 


abs() divmod() input() open() staticmethod() 
all() enumerate() int() ord() str() 
any() eval() isinstance() pow() sum() 
basestring() execfile() issubclass() print() super() 
bin() file() iter() property() tuple() 
bool() filter() len() range() type() 
bytearray() float() list() raw_input() unichr() 
callable() format() locals() reduce() unicode() 
chr() frozenset() long() reload() vars() 
classmethod() getattr() map() repr() xrange() 
cmp() globals() max() reversed() zip() 
compile() hasattr() memoryview() round() import() 
complex() hash() min() set() apply() 
delattr() help() next() setattr() buffer() 
dict() hex() object() slice() coerce() 
dir() id() oct() sorted() intern() 


abs(x) 返回 一 个 数 的 绝对 值 。 参 数 可 以 是 普通 的 整数 ， 长 整数 或 者 浮 点 数 。 如 果 参 数 是 个 复 
数 ， 返 回 它 的 模 。 


all(iterable) 如 果 iterable 的 所 有 元 素 为 真 ( 或 者 iterable 为 空 ) ， 返回 True。 等 同 于 : 


def all(iterable): 
for element in iterable: 
if not element: 
return False 
return True 


添加 于 版 本 2.5。 


any(iterable) 如 果 iterable 的 任 一 元 素 为 真 ， 返 回 True。 如 果 iterable 为 空 ， 返 回 False。 等 同 
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def any(iterable): 
for element in iterable: 
if element: 
return True 
return False 


2.5 版 本 添加 。 


basestring() 这 个 抽象 类 型 是 str 和 unicode 的 超 类 。 它 不 能 被 调用 或 者 实例 化 ， 但 是 可 以 用 来 
测试 一 个 对 象 是 否 是 str 或 者 unicode 的 实例 。isinstance(obj,basestring) 等 同 于 isinstance(obj， 


(str,unicode))。 
出 现 于 版 本 2.3。 


bin(x) 将 一 个 整数 转化 成 一 个 二 进 制 字符 串 。 结 果 是 一 个 合法 的 Python 表达 式 。 如 果 x 不 是 一 
个 Python int 对 象 ， 它 必须 定义 一 个 返回 整数 的 index() 方 法 。 


出 现 于 版 本 2.6。 


bool([x]) 将 一 个 值 转化 成 布尔 值 ， 使 用 标准 的 真 值 测试 例 程 。 如 果 x 为 假 或 者 被 忽略 它 返 回 
False ; 否则 它 返 回 True。bool 也 是 一 个 类 ， 它 是 int 的 子 类 。bool 不 能 被 继承 。 它 唯一 的 实例 
就 是 False 和 True。 


出 现 于 版 本 2.2.1。 
改变 于 版 本 2.3 : URRASR, WRORE False. 


bytearray([source[, encoding[, errors]]]) 返回 一 个 新 的 字 节 数组 。bytearray 类 型 是 一 个 可 变 的 
整数 序列 ， 整 数 范围 为 0 <= x < 256 ( 即 字 节 ) 。 它 有 可 变 序列 的 大 多 数 方法 ， 参 见 Mutable 
Sequence Types， 同 时 它 也 有 str 类 型 的 大 多 数 方法 ， 参 见 Sinrng Methods, 


Source 参 数 可 以 以 不 同 的 方式 来 初始 化 数组 ， 它 是 可 选 的 : 


e 如 果 是 string， 必 须 指明 encoding (以 及 可 选 的 errors) 参数 ; bytearray() 使 
用 str.encode() 将 字符 串 转 化 为 字 节 数组 。 
e 如 果 是 jpteger， 生 成 相应 大 小 的 数组 ， 元 素 初 始 化 为 空 字 节 。 
e 如 果 是 遵循 buffer 接 口 的 对 象 ， 对 象 的 只 读 buffer 被 用 来 初始 化 字 节 数组 。 
。 如 果 是 jterable， 它 的 元 素 必须 是 整数 ， 其 取 值 范围 为 0<=x<256， 用 以 初始 化 字 节 数组 。 


如 果 没 有 参数 ， 它 创建 一 个 大 小 为 0 的 数组 。 
出 现 于 版 本 2.6。 


callable(object) 如 果 object 参 数 可 调用 ， 返 回 True ; 否则 返回 False。 如 果 返 回 真 ， 对 其 调用 
仍 有 可 能 失败 ; 但 是 如 果 返 回 假 ， 对 object 的 调用 总 是 失败 。 注 意 类 是 可 调用 的 (对 类 调用 返 
回 一 个 新 实例 ) ; 如 果 类 实例 有 call() 方 法 ， 则 它们 也 是 可 调用 的 。 


chr(i) 返回 一 个 单字 符 字符 串 ， 字 符 的 ASCII 码 为 整数 i/。 例 如 ，chr(97) 返 回 字符 串 'a'。 它 
道 运 算 。 参 数 的 取 值 范围 为 [0..255] 的 闭 区 间 ; 如 果 / 超 出 取 值 范围 ， 抛 出 
ValueError, € Wunichr(), 


classmethod(function) 将 function 包 装 成 类 方法 。 
类 方法 接受 类 作为 隐 式 的 第 一 个 参数 ， 就 像 实例 方法 接受 实例 作为 隐 式 的 第 一 个 参数 一 样 。 
声明 一 个 类 方法 ， 使 用 这 样 的 惯例 : 


class C(object ) : 
@classmethod 
def f(cls, argi, arg2, ...): 


@classmethod 是 函数 oecoralor (装饰 器 ) 参见 Function definitions PH WBE L. 


它 即 可 以 通过 类 来 调用 (如 C.f()) ， 也 可 以 通过 实例 来 调用 COO) 。 除 了 实例 的 类 ， 实 
例 本 身 被 忽略 。 如 果 在 子 类 上 调用 类 方法 ， 子 类 对 象 被 传递 为 隐 式 的 第 一 个 参数 。 


类 方法 不 同 于 C++ 或 Java 中 的 静态 方法 。 如 果 你 希望 静态 方法 ， 这 节 的 staticmethod()。 
需要 类 方法 更 多 的 信息 ， 参 见 The standard type hierarchy 中 标准 类 型 层次 部 分 的 文档 。 
出 现 于 版 本 2.2。 

改变 于 版 本 2.4 : 添加 函数 装饰 器 语法 。 

cmp(x, y) 比较 两 个 对 象 X 和 y， 根 据 结 果 返 回 一 个 整数 。 如 果 xy， 返 回 正 数 。 


compile(source, filename, model, flags[, dont_inherit]]) 将 source 编 译 成 代码 对 象 ， 或 者 
AST (Abstract Syntax Tree， 抽 象 语法 树 ) 对 象 。 代 码 对 象 可 以 经 由 exec 语 句 执 行 ， 或 者 通 
过 调用 eval() 演 算 。souwrce 可 以 是 Unicode 字 符 串 ，Latin-1 编 码 的 字符 串 或 者 AST 对 象 。 参 
考 ast 模 块 文档 以 了 解 如 何 和 AST 对 象 一 起 使 用 的 信息 。 


filename 参 数 指明 一 个 文件 ， 从 该 文件 中 读 取 ( 源 ) 代码 ; 如 果 代码 不 是 从 文件 中 读 入 ， 传 递 
一 个 可 识别 的 值 ( 一 般 用 ") 。 


mode 参 数 指 明了 编译 成 哪 一 类 的 代码 ; 它 可 以 是 'exec'， 如 果 souwrce 包 含 一 组 语句 ; 也 可 以 
是 'eval'， 如 果 是 单一 的 表达 式 ; 或 者 是 'single'"'， 如 果 是 单一 的 交互 式 语句 (对 于 最 后 一 种 情 
况 ， 如 果 表 达 式 语句 演算 成 非 None， 它 的 值 会 被 打印 ) 。 


选 的 参数 jeags 和 dont_jnherit 控 制 哪些 future 语 句 (W PEP 236) 影响 source 的 编译 。 如 果 没 
有 这 两 个 参数 (或 者 都 为 0) ， 使 用 调用 compile 的 代码 当前 有 效 的 future 语 名 来 编译 Source。 
如 果 给 出 了 flags 参 数 且 没有 给 出 dont_inherit 参 数 (或 者 为 0) ， 除 了 本 该 使 用 的 future 语 句 之 
外 ， 由 flags 参 数 指明 的 future 语 句 也 会 影响 编译 。 如 果 dont_inherit 是 非 0 整 数 ，flags 参 数 被 忽 
B& (调用 compile 周 围 的 有 效 的 future 语 句 被 忽略 ) 。 


future 语 句 由 bit 位 指明 ， 这 些 bit 可 以 做 或 运算 ， 以 指明 多 个 语句 。 可 以 在 future 模 块 中 ， 
_Feature 实 例 的 compiler_ flag 属 性 找到 指明 功能 的 bit 位 。 


如 果 被 编译 的 源 代 码 是 不 合法 的 ， 画 数 抛 出 SyntaxError ; 如 果 源 代码 包含 空 字 节 ， 画 数 抛 出 
TypeError。 


注意 

当 以 'single' 或 者 'eval' 模 式 编译 多 行 代码 字符 串 的 时 候 ， 输 入 至 少 以 一 个 新 行 结尾 。 这 主要 是 
便于 code 模 块 检 测 语句 是 否 结束 。 

改变 于 版 本 2.3 : 添加 了 flags 和 dont inherit, 

改变 于 版 本 2.6 : 支持 编译 AST 对 象 。 


改变 于 版 本 2.7 : 允许 使 用 Windows 和 Mac 的 新 行 字 符 。'exec' 模 式 下 的 输入 不 需要 以 新 行 结 
束 。 


complex([real[, imag]]) 创建 一 个 复数 ， 它 的 值 为 real + imag"*j ; 或 者 将 一 个 字符 串 数字 转 
化 成 一 个 复数 。 如 果 第 一 个 参数 是 个 字符 串 ， 它 将 被 解释 成 复数 ， 同 时 函数 不 能 有 第 二 个 参 
数 。 第 二 个 参数 不 能 是 字符 串 。 每 个 参数 必须 是 数值 类 型 (包括 复数 ) 。 如 果 imag* 被 忽略 ， 
它 的 默认 值 是 0， 这 时 该 画 数 就 像 是 int()，long() 和 float() 这 样 的 数值 转换 画 数 。 如 果 两 个 参数 
都 被 忽略 ， 返 回 0j。 


— pim 
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当 从 字符 串 转 化 成 复数 的 时 候 ， 字 符 串 中 + 或 者 -两 边 不 能 有 空白 。 例 如 ，complex('1+2j) 是 可 
行 的 ， 但 complex('1+2 站 会 抛 出 ValueError 有 异常 。 


在 Numeric Types — int, float, long, complex 中 有 对 复数 的 描述 。 


delattr(object, name) 这 个 函数 和 setattr() 有 关 。 参 数 是 一 个 对 象 和 一 个 字符 串 。 字 符 串 必须 是 
对 象 的 某 个 属性 的 名 字 。 只 要 对 象 人 多 许 ， 这 个 画 数 删 除 该 名 字 对 应 的 属性 。 例 如 ， 
delattr(x,foobar) 等 同 于 delx.foobar。 


dict(kwarg)dict(mapping, *kwarg)dict(iterable, **kwarg) 创建 一 个 新 字典 。 dict 对 象 就 是 字典 
类 。 参 见 ojct 和 /Mapping Types 一 dict*](#) 以 得 到 关于 该 类 的 文档 。 


参见 list，set， 和 tuple 类 以 及 collections 模 块 了 解 其 它 的 容器 。 


dir([object]) 如 果 没 有 参数 ， 返 回 当 前 本 地 作用 域内 的 名 字 列 表 。 如 果 有 参数 ， 党 试 返回 参数 
所 指明 对 象 的 合法 属性 的 列表 。 


如 果 对 象 有 dir() 方 法 ， 该 方法 被 调用 且 必 须 返 回 一 个 属性 列表 。 这 人 允许 实现 了 定制 化 的 
getattr() 或 者 getattribute() 函 数 的 对 象 定制 dir() 报 告 对 象 属性 的 方式 。 


如 果 对 象 没有 提供 dir()， 同 时 如 果 对 象 有 定义 dict 属 性 ，dir() 会 先 尝试 从 dict 属 性 中 收集 信 
息 ， 然 后 是 对 象 的 类 型 对 象 。 结 果 列 表 没 有 必要 是 完整 的 ， 如 果 对 象 有 定制 化 的 getattr()，z 
果 还 有 可 能 是 不 准确 的 。 


DH 


对 于 不 同类 型 的 对 象 ， 默 认 的 dir() 行 为 也 不 同 ， 因 为 它 党 试 产生 相关 的 而 不 是 完整 的 信息 : 


e 如 果 对 象 是 模块 对 象 ， 列 表 包 含 模 块 的 属性 名 。 
。 如 果 对 象 是 类 型 或 者 类 对 象 ， 列 表 包 含 类 的 属性 名 ， 及 它 的 基 类 的 属性 名 。 
。 否则 ， 列 表 包 含 对 象 的 属性 名 ， 它 的 类 的 属性 名 和 类 的 基 类 的 属性 名 。 


返回 的 列表 按 字 母 顺 序 排 序 。 例 如 : 


>>> Import Struct 
>>> dir() # show the names in the module namespace 








['__builtins__', ' doc ', '__name__', 'struct'] 

>>> dir(struct) 4 show the names in the struct module 

['Struct', ' builtins ^', ' doc ^", ' file ^", ' name 
' package ', ' clearcache', 'calcsize', 'error', 'pack', 'pack into', 
'unpack', 'unpack from'] 


>>> class Shape(object): 
def _ dir (self): 
return ['area', 'perimeter', 'location'] 
>>> s = Shape() 
>>> dir(s) 


['area', 'perimeter', 'location'] 
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因为 dir() 主 要 是 为 了 在 交互 式 环境 下 使 用 方便 ， 它 党 试 提供 有 意义 的 名 字 的 集合 ， 而 不 是 提供 
严格 或 一 致 定义 的 名 字 的 集合 ， 且 在 不 同 的 版 本 中 ， 具 体 的 行为 也 有 所 变化 。 例 如 ， 如 果 参 
数 是 一 个 类 ， 那 么 元 类 属性 就 不 会 出 现在 结果 中 。 


divmod(a, b) 在 长 整数 除法 中 ， 传 入 两 个 数字 GERM) 作为 参数 ， 返 回 商 和 余数 的 二 元 组 。 
对 于 混合 的 操作 数 类 型 ， 应 用 二 元 算术 运算 符 的 规则 。 对 于 一 般 或 者 长 整数 ， 结 果 等 同 于 
(a//b,a%b)。 对 于 浮 点 数 结果 是 (q,a%b)，9 一 般 是 math.floor(a/b)， 但 也 可 能 比 那 小 1。 不 管 怎 
样 ，qb+a9%bb 非 常 接近 于 a， 如 果 a%b 非 0， 它 和 b* 符 号 相同 且 0<=abs(a%b)<abs(b)。 


改变 于 版 本 2.3 : 废弃 了 在 divmod() 中 使 用 复数 。 


enumerate(sequence, start=0) 返回 一 个 枚 举 对 象 。seqguemce 必 须 是 个 序列 ， 和 迭代 
器 jterator， 或 者 支持 迭代 的 对 象 。enumerate() 返 回 的 迭代 器 的 next() 方 法 返回 一 个 元 组 ， 它 
包含 一 个 计数 (从 start 开 始 ， 上 默认 为 0) 和 从 sequence 中 和 迭代 得 到 的 值 : 


>>> seasons = ['Spring', 'Summer', 'Fall', 'Winter'] 

>>> list(enumerate(seasons) ) 

[(0, 'Spring'), (1, 'Summer'), (2, 'Fall'), (3, 'Winter')] 
>>> list(enumerate(seasons, start-1)) 

[(1, 'Spring'), (2, 'Summer'), (3, 'Fall'), (4, 'Winter')] 


等 同 于 : 


def enumerate(sequence, start=0): 
n = start 
for elem in sequence: 
yield n, elem 
n += 1 


出 现 于 版 本 2.3。 
改变 于 版 本 2.6 : 添加 了 start 参 数 。 


eval(expression[, globals[, locals]]) 参数 是 Unicode 或 者 Latin-1 编 码 的 字符 串 ， 全 局 变量 和 局 
部 变量 可 选 。 如 果 有 全 局 变量 ，9/obals 必 须 是 个 字典 。 如 果 有 局 部 变量 ，/ocals 可 以 是 任何 映 
射 类 型 对 象 。 


改变 于 版 本 2.4 : 在 此 之 前 /ocals 需 要 是 个 字典 。 


expression 参 数 被 当 作 Python 表 过 式 来 解析 并 演算 (技术 上 来 说 ， 是 个 条 件 列 表 ) ， 使 

用 globals 和 /ocals 字 典 作为 全 局 和 局 部 的 命名 空间 。 如 果 g/lobals 字 典 存在 ， 且 缺少 'builtins”， 
在 expression 被 解析 之 前 ， 当 前 的 全 局 变量 被 拷贝 进 globals。 这 意味 着 一 般 来 说 expression 能 
完全 访问 标准 builtin 模 块 ， 且 受 限 的 环境 会 传播 。 如 果 /ocals 字 典 被 忽略 ， 默 认 是 g/obals 字 
典 。 如 果 都 被 忽略 ， 表 达 式 在 eval() 被 调用 的 环境 中 执行 。 返 回 值 是 被 演算 的 表达 式 的 结果 。 
语法 错误 报告 成 异常 。 例 子 : 


>>> X = 1 
>>> print eval('x+1') 
2 


该 画 数 也 能 执行 任意 的 代码 对 象 (如 compile() 返 回 的 结果 ) 。 在 这 种 情况 下 ， 传 递 代 码 对 象 
而 不 是 字符 串 。 如 果 代码 对 象 编译 时 mode 参 数 为 'exec'，eval() 返 回 None。 


提示 : exec 语 名 支持 动态 的 语句 执行 。execfile() 函 数 支持 执行 文件 中 的 语句 。globals() 和 
locals() 画 数 返 回 当前 的 全 局 变量 和 局 部 变量 的 字典 ， 可 以 传递 给 eval() 或 者 execfile()。 


2 Nastliteral _eval()， 该 函数 能 安全 演算 只 含 字面 量 的 表达 式 的 字符 串 。 


execfile(filename[, globals[, locals]]) 该 图 数 类 似 于 exec 语 句 ， 它 解析 一 个 文件 而 不 是 字符 
串 。 它 不 同 于 import 语 句 的 地 方 在 于 它 不 使 用 模块 管理 一 一 它 无 条 件 的 读 入 文件 且 不 会 创建 一 
个 新 模块 。[1] 


参数 是 个 文件 名 和 两 个 可 选 的 字典 。 文 件 被 当成 Python 语句 序列 来 解析 并 演算 (类似 于 模 
ik) ， 使 用 g/lobals 和 /ocals 字 典 作为 全 局 和 局 部 的 命名 空间 。 如 果 存 在 ，/ocals 可 以 是 任意 的 
映射 类 型 对 象 。 记 住 在 模块 级 别 ， 全 局 和 局 部 字典 是 同一 个 字典 。 如 果 g/lobals 和 /ocals 是 两 个 
不 同 的 对 象 ， 代 码 就 好 象 是 能 入 在 类 定义 中 被 执行 。 


改变 于 版 本 2.4 : 在 此 之 前 /ocals 必 须 是 个 字典 。 


如 果 /ocals 字 典 被 忽略 ， 默 认 是 globals 字 典 。 如 果 两 个 字典 都 被 忽略 ， 表 达 式 在 execfile() 被 调 
用 的 环境 中 执行 。 返 回 None。 


注意 
默认 的 /ocal/s 的 行为 和 下 述 的 locals() 函 数 一 样 : 不 应 该 尝试 修改 默认 的 /ocals 字 典 。 如 果 


在 execifile() 函 数 返 回 后 ， 你 希望 看 到 作用 于 /ocals 的 代码 的 效果 ， 显 示 地 传递 一 个 /ocals 字 
典 。execfile() 不 能 用 于 可 靠 地 修改 一 个 函数 的 局 部 变量 。 


file(name[, mode[, buffering]]) file 类 型 的 构造 男 数 ， 进 一 步 的 描述 见 File ObjectsS& 7. Wish 
数 的 参数 同 下 述 的 open() 内 置 画 数 。 


要 打开 一 个 文件 ， 建 议 使 用 open() 而 不 是 直接 调用 该 构造 男 数 。file 更 适合 于 类 型 测试 〈 例 
如 ，isinstance(f,file)) 。 


出 现 于 版 本 2.2。 


filter(function, iterable) 构造 一 个 列表 ， 列 表 的 元 素来 自 于 iterable， 对 于 这 些 元 素 function 返 回 
真 。iterable 可 以 是 个 序列 ， 支 持 迭 代 的 容器 ， 或 者 一 个 迭代 器 。 如 果 iterable 是 个 字符 串 或 者 
元 组 ， 则 结果 也 是 字符 串 或 者 元 组 ; 否则 结果 总 是 列表 。 如 果 function 是 None， 使 用 特性 函 
数 ， 即 为 假 的 iterable 被 移 除 。 


注意 ， 在 function 不 为 None 的 情况 下 ，filter(function ,iterable) 等 同 于 
[itemforiteminiterableiffunction(item)] ; 否则 等 同 于 [itemforiteminiterableifitem] (function 为 
None) 。 


参见 itertools.ifilter() 和 itertools.ifilterfalse()， 以 得 到 该 函数 的 迭代 器 版 本 ， 以 及 该 函数 的 变 体 
(过 滤 function 返 回 假 的 元 素 ) 。 


float([x]) 将 字符 串 或 者 数字 转化 成 浮 点 数 。 如 果 人 参数 是 字符 串 ， 它 必须 包含 小 数 或 者 浮 点 数 

(可 以 有 符号 ) ， 周 围 可 以 有 空白 。 参 数 也 可 以 是 [+|-]nan 或 者 [+|-]inf。 其 它 情况 下 ， 参 数 可 
以 是 原始 一 关 整 数 或 者 浮 点 数 ，〈 以 Python 的 浮 点 数 精度 ) 返回 具有 相同 值 的 浮 点 数 。 如 果 
没有 参数 ， 返 回 0.0。 


Ads pie 
TER 


当 传递 字符 串 时 ， 依 赖 于 底层 的 C 库 ， 可 以 返回 NaN (Not a Number， 不 是 一 个 数字 ) 和 
Infinity (AA) RNG. BABS Bnan (NaN) , inf ( 正 无 穷 大 ) 和 -inf (AZ 
FAK) 。 对 于 NaN， 不 区 分 大 小 宇和 +/- 号 。 总 是 用 nan，inf 或 者 -inf 来 表示 NaN 和 Infinity。 


float 类 型 描述 于 Numeric Types — int, float, long, complex. 


format(value[, format_spec]) 将 value 转 化 成 “格式 化 ”的 表现 形式 ， 格 式 由 format_spec 控 制 。 
对 format_spec 的 解释 依赖 于 Value 人 参数 的 类 型 ， 大 多 数 内 置 类 型 有 标准 的 格式 化 话 


ik : Format Specification Mini-Language。 
注意 
format(value,formatspec) {2 {x 44 Favalue._format(format_spec). 
出 现 于 版 本 2.6。 


frozenset([iterable]) 返回 一 个 新 的 frozenset 对 象 ， 如 果 可 选 参数 jerable 存 在 ，frozenset 的 元 
素来 自 于 iterable。frozenset 是 个 内 置 类 。 参 见 frozenset 和 Set Types — set, frozenset, 


关于 其 它 容 器 ， 参 见 set，list，tuple， 和 dict 类 ， 以 及 collections 模 块 。 
出 现 于 版 本 2.4。 


getattr(object, name|, derau 返回 object 的 属性 值 。name 必 须 时 个 字符 串 。 如 果 字 符 串 时 对 
象 某 个 属性 的 名 字 ， 则 返回 该 属性 的 值 。 例 如 ，getattr(x,'foobar') 等 同 于 x.foobar。 如 果 名 字 
指明 的 属性 不 存在 ， 且 有 default 参 数 ，default 被 返回 ; 否则 抛 出 AttributeError。 


globals() 返回 表示 当前 全 局 符号 表 的 字典 。 它 总 是 当前 模块 的 字典 (在 函数 或 者 方法 中 ， 
指定 义 的 模块 而 不 是 调用 的 模块 ) 。 

hasattr(object, name) 参数 是 一 个 对 象 和 一 个 字符 串 。 如 果 字 符 串 是 对 象 某 个 属性 的 名 字 ， 返 
回 True ; 否则 返回 False。 (实现 方式 为 调用 getattr(object,name)， 看 它 是 否 抛 出 异常 ) 。 


hash(object) 返回 对 象 的 hash ( 哈 希 / 散 列 ) 值 (如 果 有 的 话 ) 。hash 值 是 整数 。 它 被 用 于 在 
字典 查找 时 快速 比较 字典 的 键 。 相 同 的 数值 有 相同 的 hash (尽管 它们 有 不 同 的 类 型 ， 上 比如 1 和 
1.0) 。 


help([object]) 调用 内 置 的 帮助 系统 。 (这 个 图 数 主 要 用 于 交互 式 使 用 。) 如 果 没 有 参数 ， 在 

解释 器 的 控制 台 和 启动 交互 式 帮 助 系统 。 如 果 参 数 是 个 字符 串 ， 该 字符 串 被 当 作 模块 名 ， 画 数 

类 名 ， 方 法 名 ， 关 键 字 或 者 文档 主题 而 被 查询 ， 在 控制 台 上 打印 帮助 页 面 。 如 果 参 数 是 
它 某 种 对 象 ， 生 成 关于 对 象 的 帮助 页 面 。 


函数 经 由 site 模 块 加 入 内 置 的 命名 空间 。 
出 现 于 版 本 2.2。 
hex(x) 将 任意 大 小 的 整数 转化 成 以 “0x" 打 头 的 小 宇 的 十 六 进 制 字符 串 ， 例 如 : 


>>> hex(255) 
‘Oxf f' 
>>> hex(-42) 
'-0x2a' 
>>> hex(1L) 
"@x1L' 


如 果 x 不 是 Python 的 int 或 者 long 对 象 ， 它 必须 定义 index() 方 法 以 返回 一 个 整数 。 
参见 int()， 它 将 十 六 进 制 字符 串 转 化 成 一 个 整数 。 

注意 

使 用 float.hex() 方 法 得 到 浮 点 数 的 十 六 进 制 字符 串 表 示 。 

改变 于 版 本 2.4 : 在 此 之 前 只 返回 无 符号 数 。 


id(object) 返回 对 象 的 标识。 这 是 一 个 整数 (或 长 整数 ) ， 保 证 在 对 象 的 生命 期 内 唯一 且 不 
变 。 生 命 期 不 重合 的 两 个 对 象 可 以 有 相同 的 id() 值 。 


CPython 实 现 细节 : 这 是 对 象 的 内 存 地 址 。 
input([prompt]) 等 同 于 eval(raw_input(prompt))。 


该 贺 数 不 会 捕获 用 户 错 误 。 如 果 输 入 语法 不 合法 ， 将 抛 出 SyntaxError。 如 果 演 算 中 有 错误 ， 
将 抛 出 其 它 异 常 。 


如 果 有 装载 readline，input() 将 会 用 它 来 提供 复 条 的 行 编辑 和 万 史 功 能 。 
考虑 使 用 raw_input() 函 数 来 得 到 用 户 的 一 般 输 入 。 


int(x=0)int(x, base-10) 将 数字 或 字符 串 x 转化 成 一 个 整数 ， 如 果 没 有 参数 则 返回 0。 如 果 x 是 个 
数字 ， 它 可 以 是 原始 了 长 整数 ， 或 者 浮 点 数 。 如 果 x 是 浮 点 数 ， 则 向 0 截断 。 如 果 参 数 超出 了 
整数 的 范围 ， 则 返回 长 整数 对 象 。 


如 果 x 不 是 个 数字 ， 或 者 存在 base 参 数 ， 则 x 必须 是 个 表示 以 base 为 基数 的 integer literal( 整 
数字 面 量 ) 的 字符 串 或 者 Unicode 对 象 。 字 面 量 的 前 面 可 以 有 + 或 者 - (中 间 不 能 有 空格 ) ， 周 
围 可 以 有 空白 。 以 n 为 基数 的 字面 量 包 含 数 字 0 到 n-1， 用 a 到 z (或 者 A 到 Z) 来 表示 10 到 35。 
默认 的 base 是 10。 人 允许 的 值 为 0 和 2-36。 二 进 制 ， 八 进 制 和 十 六 进 制 的 字面 量 前 面 可 以 有 
0b/0B，0o/00/0， 或 者 0x/0X， 就 像 代 码 中 的 整数 字面 量 一 样 。 基 数 0 表示 严格 按 整数 字面 量 
来 解释 字符 串 ， 所 以 实际 的 基数 为 2，8，10 或 者 16。 


整数 类 型 描述 于 Numeric Types — int, float, long, complex. 


isinstance(object, classinfo) 如 果 参 数 object 是 参数 classinfo 的 一 个 实例 ; 或 者 是 一 个 子 类 
(直接 的 ， 间 接 的 ， 或 者 viriua/) ， 返 回 真 。 如 果 classinfo 是 类 型 对 象 (新 式 类 ) 而 object 是 
该 类 型 对 象 ; 或 者 是 其 子 类 (直接 的 ， 间 接 的 ， 或 者 virtual/) ， 返 回 真 。 如 果 object 不 是 给 定 


类 型 的 类 实例 或 者 对 象 ， 该 图 数 总 是 返回 假 。 如 果 classinfo 既 不 是 类 对 象 ， 也 不 是 类 型 对 象 ， 
它 可 以 是 类 二 类 型 对 象 的 元 组 ， 或 者 递归 包含 这 样 的 元 组 〈 不 接受 其 它 的 序列 类 型 ) 。 如 果 
classinfo 不 是 类 ， 类 型 ， 类 二 类 型 的 元 组 ， 抛 出 TypeError 异 常 。 


改变 于 版 本 2.2 : 添加 对 类 型 信息 的 元 组 的 支持 。 


issubclass(class, classinfo) 如 果 class 是 classinfo 的 子 类 (直接 的 ， 间 接 的 ， 或 者 virtuaj) ， 返 
回 真 。 一 个 类 被 认为 是 它 自己 的 子 类 。classinfo 可 以 是 类 对 象 的 元 组 ， 这 时 classinfo 中 的 每 个 
类 对 象 都 会 被 检查 。 其 它 情况 下 ， 抛 出 TypeError 异 常 。 


改变 于 版 本 2.3 : 添加 对 类 型 信息 的 元 组 的 支持 。 


iter(o[, sentinel) 返回 一 个 iterator 对 象 。 根 据 有 无 第 二 个 参数 ， 对 第 一 个 参数 的 解释 相差 很 
大 。 如 果 没 有 第 二 个 参数 ，o 必 须 是 个 集合 对 象 ， 要 么 支持 迭代 协议 ( 即 iter() 方 法 ) ， 要 么 
支持 序列 协议 ( 即 getitem() 方 法 ， 整 数 参 数 从 0 开始 ) 。 如 果 这 些 协 议 都 不 支持 ， 抛 出 
TypeError。 如 果 有 第 二 个 参数 sentine/，o 必 须 是 个 可 调用 对 象 。 这 种 情况 下 返回 的 迭代 ， 每 
当 调 用 其 next() 方 法 时 ， 将 会 调用 o (不 带 参数 ) ; 如 果 返 回 值 等 于 sentine/， 搜 出 
Stoplteration， 否 则 返回 该 值 。 


第 二 种 形式 的 iter() 的 一 个 有 用 的 应 用 就 是 读 一 个 文件 的 行 ， 直 到 读 到 特定 行 。 下 面 的 例子 读 
一 个 文件 ， 直 到 readline() 方 法 返回 一 个 空 字 符 串 : 


with open('mydata.txt') as fp: 
for line in iter(fp.readline, ''): 
process_line(line) 


出 现 于 版 本 2.2。 


len(s) 返回 对 象 的 长 度 (元 素 的 个 数 ) 。 参 数 可 以 是 序列 〈 如 字符 串 ， 字 节 ， 元 组 ， 列 表 或 者 
范围 ) 或 者 集合 (如 字典 ， 集 合 或 者 固定 集合 ) 。 

list([iterable]) 返回 一 个 列表 ， 其 元 素来 自 于 iterable (保持 相同 的 值 和 顺序 ) 。jiterable 可 以 是 
个 序列 ， 支 持 迭 代 的 容器 ， 或 者 迭代 器 对 象 。 如 果 iterable 已 经 是 个 列表 ， 返 回 其 拷贝 ， 类 似 
于 iterable[:]。 例 如 ，list('abc') 返 回 ['a','b','c]，list((1,2,3)) 返 回 [1,2,3]。 如 果 没 有 参数 ， 返 回 一 
TAA ZN IR, [l 

list 是 可 变 序列 类 型 ， 见 文档 Sequence Types — str, unicode, list, tuple, bytearray, buffer, 
xrange。 关 于 其 它 容 器 参见 内 置 dict，set， 和 tuple 类 ， 以 及 collections 模 块 。 


locals() 更 新 并 返回 表示 当前 局 部 符号 表 的 字典 。 当 locals 在 函数 块 中 而 不 是 类 块 中 被 调用 
时 ，locals() 返 回 自由 变量 。 


— api 
TER 


不 应 该 修改 该 字典 的 内 容 ; 所 做 的 改变 不 一 定 会 影响 到 解释 器 所 用 的 局 部 和 自由 变量 的 值 。 


long(x=0)long(x, base=10) 将 一 个 字符 串 或 者 数字 转化 成 一 个 长 整数 。 如 果 参 数 时 个 字符 

串 ， 它 必须 包含 一 个 数字 ， 任 意 大 小 ， 可 以 有 符号 ， 周 围 可 以 有 空白 。base 参 数 和 int() 中 的 一 
样 ， 只 有 当 x 是 字符 串 的 时 候 才 能 有 此 参数 。 其 它 情况 下 ， 参 数 可 以 是 个 原始 长 整数 ， 或 者 
浮 点 数 ， 返 回 具 有 相同 值 的 长 整数 。 浮 点 数 转 成 整数 时 将 浮 点 数 向 零 截 断 。 如 果 没有 参数 ， 
REOL, 

k E a WH Numeric Types — int, float, long, complex. 


map(function, iterable, ...) 将 function 应 用 于 iterable 的 每 一 个 元 素 ， 返 回 结果 的 列表 。 如 果 有 
额外 的 jterable 参 数 ， 并 行 的 从 这 些 参数 中 取 元 素 ， 并 调用 function。 如 果 一 个 参数 比 另 外 的 要 
短 ， 将 以 None 扩 展 该 参数 元 素 。 如 果 function 是 None 使 用 特性 函数 ; 如 果 有 多 个 参数 ，map() 
返回 一 元 组 列表 ， 元 组 包含 从 各 个 参数 中 取得 的 对 应 的 元 素 〈 某 种 变换 操作 ) 。jterable 参 数 
可 以 是 序列 或 者 任意 可 迭代 对 象 ; 结果 总 是 列表 。 


max(iterable[, key])max(arg1, arg2, *args[, key]) 返回 可 迭代 的 对 象 中 的 最 大 的 元 素 ， 或 者 返 
回 2 个 或 多 个 参数 中 的 最 大 的 参数 。 


如 果 有 一 个 位 置 人 参数 ，jterable 必 须 是 个 非 空 的 可 迭代 对 象 〔( 如 非 空 字符 串 ， 元 组 或 者 列 
X) 。 返 回 可 迭代 对 象 中 最 大 的 元 素 。 如 果 有 2 个 或 更 多 的 位 置 参数 ， 返 回 最 大 位 置 参数 。 


可 选 的 Key 参数 指明 了 有 一 个 参数 的 排序 函数 ， 如 list.sort() 中 使 用 的 排序 范 数 。 如 果 有 /Key 参 
数 ， 它 必须 是 关键 字 参 数 (例如 ，max(a,b,c,key=func)) . 


改变 于 版 本 2.5 : 添加 了 对 可 选 参数 Key 的 支持 。 
memoryview(obj) 返回 给 定 参 数 的 “内 存 视图 ”。 参 见 memoryview type. 


min(iterable[, key])min(arg1, arg2, *args[, key]) 返回 可 迭代 的 对 象 中 的 最 小 的 元 素 ， 或 者 返回 
2 个 或 多 个 参数 中 的 最 小 的 参数 。 


如 果 有 一 个 位 置 人 参数 ，jterable 必 须 是 个 非 空 的 可 迭代 对 象 〔( 如 非 空 字符 串 ， 元 组 或 者 列 
X) 。 返 回 可 迭代 对 象 中 最 小 的 元 素 。 如 果 有 2 个 或 更 多 的 位 置 参 数 ， 返 回 最 小 的 位 置 参 数 。 


可 选 的 key 参 数 指明 了 有 一 个 参数 的 排序 范 数 ， 如 list.sort() 中 使 用 的 排序 函数 。 如 果 有 key 参 
数 ， 它 必须 是 关键 字 参 数 (例如 ，min(a,b,c,key=func)) o 


改变 于 版 本 2.5 : 添加 了 对 可 选 参数 key 的 支持 。 


next(iterator[, default]) 通过 调用 iterator 的 next() 方 法 ， 得 到 它 的 下 一 个 元 素 。 如 果 有 default 参 
数 ， 在 迭代 器 迭代 完 所 有 元 素 之 后 返回 该 参数 ; 否则 抛 出 Stoplteration。 


出 现 于 版 本 2.6。 


object() 返回 一 个 新 的 无 特征 的 对 象 。object 是 所 有 新 式 类 的 基 类 。 它 有 对 所 有 新 式 类 的 实例 
通用 的 方法 。 


出 现 于 版 本 2.2。 


改变 于 版 本 2.3 : AHATZ. ELA, CERSA, FESR. 
oct(x) 将 一 个 (任意 尺寸 ) 整数 转化 成 一 个 八进制 字符 串 。 结 果 是 一 个 合法 的 Python 表达 式 。 
改变 于 版 本 2.4 : 以 前 只 返回 一 个 无 符号 数字 面 量 。 


open(name[, mode[, buffering]]) 打开 一 个 文件 ， 返 回 一 个 file 类 型 的 对 象 ，file 类 型 描述 于 Fi/le 
Objects 章 节 。 如 果 文 件 不 能 打开 ， 抛 出 IOError。 当 要 打开 一 个 文件 ， 优 先 使 用 open()， 而 不 
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头 两 个 参数 类 似 于 stdio's fopen() 的 参数 : name 是 要 打开 的 文件 的 名 字 ，mode 是 个 指示 如 何 
打开 文件 的 字符 串 。 


mode 的 常用 值 包括 : r 读 文件 ; w 写 文件 〈 如 果 文 件 存在 则 截断 之 ) ; 'a' 附加 (在 某 些 Unix 
系统 上 意味 着 所 有 的 写 操 作 附加 到 文件 的 末尾 ， 不 管 当 前 的 写 位 置 ) 。 如 果 没 有 mode， 默 认 
是 ""。 默 认 使 用 文本 模式 ， 它 会 在 写 文 件 时 将 \n' 字 符 转 化 成 平台 特定 的 字符 ， 在 读 文件 时 又 转 
回来 。 因 此 在 打开 二 进 制 文件 的 时 候 ， 要 以 二 进 制 模式 打开 文件 ， 把 'b' 添 加 到 /modqe 值 ， 这 样 
可 以 增强 可 移植 性 。 〈 在 不 区 分 二 进 制 文件 和 文本 文件 的 系统 上 ， 附 加 'b' 仍 然 时 有 用 的 ， 它 可 
以 起 到 文档 的 目的 。) 参见 下 文 以 得 到 mode 更 多 的 可 能 的 值 。 


可 选 的 buffering 参 数 指明 了 文件 需要 的 缓冲 大 小 : 0 意味 着 无 缓冲 ; 1 意味 着 行 缓冲 ; 其 它 正 
值 表 示 使 用 参数 大 小 的 缓冲 〈 大 概 值 ， 以 字 节 为 单位 ) 。 负 的 buffering 意 味 着 使 用 系统 的 默认 
值 ， 一 般 来 说 ， 对 于 tty 设 备 ， 它 是 行 缓冲 ; 对 于 其 它 文 件 ， 它 是 全 缓冲 。 如 果 没 有 改 参 数 ， 
使 用 系统 的 默认 值 。[2] 


模式 r+',，w+' 和 'a+' 打 开 文 件 以 便 更 新 〈 同 时 读 写 ) 。 注 意 'w+' 会 截断 文件 。 在 区 分 文本 文件 
和 二 进 制 文件 的 系统 上 ， 在 模式 中 附加 'b' 会 以 二 进 制 模式 打开 文件 ; 在 不 区 分 的 系统 上 ， 添 
加 'b' 没 有 效果 。 


除了 标准 的 fopen() 模 式 值 ，mode 可 以 是 'U' 或 者 TU'。 构 建 Python 时 一 般 会 添加 uwniversal 
newlines (统一 新 行 ) 支持 ; 'U' 会 以 文本 模式 打开 文件 ， 但 是 行 可 以 以 以 下 字符 结 

BR: \n' (Unix 行 结束 符 ) ，\ (Macintosh 惯 例 ) ， 或 者 \An' (Windows®) 。Python 程 序 
会 认为 它们 都 是 \n'。 如 果 构 建 Python 时 没有 添加 统一 新 行 的 支持 ，mode'U' 和 普通 文本 模式 一 
样 。 注 意 ， 这 样 打开 的 文件 对 象 有 一 个 叫 newlines 的 属性 ， 它 的 值 是 None (没有 发 现 新 

行 ) ，\n'"，"\r，"\rin'"， 或 者 是 包含 所 有 已 发 现 的 新 行 字符 的 元 组 。 


Python 要 求 模式 字符 串 在 去 除 'U' 后 以 7Y"，'wW' 或 者 'a' 开 头 。 
Python 提 供 了 许多 文件 处 理 模 块 ， 包 括 fileinput，os，os.path，tempfile 和 shutil。 
改变 于 版 本 2.5 : 引入 了 对 模式 字符 串 第 一 个 字符 的 限制 。 


ord(c) 给 定 一 个 长 度 为 一 的 字符 串 ， 如 果 参 数 是 unicode 对 象 ， 则 返回 表示 字符 的 代码 点 的 整 
数 ; 如 果 参 数 是 八 位 字符 串 ， 返 回 字 节 值 。 例 如 ，ord('a) 返 回 整数 97，ord(u\u2020)) 返 回 
8224。 它 是 八 位 字符 串 chr() 的 反 本 数 ， 也 是 unicode 对 象 unichr() 的 反 画 数 。 如 果 参 数 是 


unicode 且 构建 Python 时 添加 了 UCS2 Unicode 支 持 ， 那 么 字符 的 码 点 必须 在 [0..65535] 的 闭 区 
间 ; 如 果 字 符 串 的 长 度 为 2， 则 抛 出 TypeError。 


pow(x, y[, z]) 返回 x 的 WR HOR z 提供 的 时 候 ，, 返回 x Ny RE, TAI z 取 模 。( 这 样 比 
pow(x,y)%z) 更 高 效 。 两 个 参数 的 形式 pow(x,y) 与 使 用 操作 符 : x**y 是 等 价 的 。 


参数 必须 是 数字 类 型 的 。 由 于 操作 数 是 混合 类 型 的 ， 二 进 制 计算 的 原因 需要 一 些 强 制 的 规 
定 。 对 于 整 型 和 长 整 型 的 操作 数 ， 计 算 结 果 和 操作 数 (强制 后 的 ) 是 相同 的 类 型 。 除 非 第 二 
个 参数 是 负数 。 在 这 种 情况 下 , 所 有 的 参数 都 会 被 转化 成 浮 点 型 ， 并 且 会 返回 一 个 浮 点 的 结 
果 。 例 如 , 102 返回 100, 但 10-2 返回 0.01.( 这 个 新 特性 被 加 入 在 Python2.2 中 在 Python2.1 和 
之 前 的 版 本 中 ,如 果 两 个 参数 是 整 型 ， 并 且 第 二 个 参数 为 负数 的 情况 下 ， 会 抛 出 一 个 异常 。) 
如 果 第 二 个 参数 为 负数 ， 那 么 第 三 个 参数 必须 省 略 。 如 果 提 供 参 数 z , xand y 必须 为 整数 ， 
而 且 y 要 是 非 负 整数 。( 这 个 限制 是 在 Python2.2 加 入 的 。Python2.1 以 及 之 前 的 版 本 , 三 个 参数 
都 是 浮 点 型 的 pow() 版 本 ， 返 回 的 结果 依赖 平台 对 于 浮 点 数 的 取 整 情况 。) 


print(*objects, sepz' ', end='\n', file=sys.stdout) 以 sep 分 割 ，end 的 值 结 尾 ， 将 目标 对 象 打印 
到 文件 流 中 。sep, end 和 file， 如 果 提 供 这 三 个 参数 的 话 ， 必 须 以 键 值 的 形式 。 


所 有 非 键 值 形式 提供 的 参数 ， 都 被 转化 为 字符 串 ， 就 像 用 str() 转 化 那样 。 然 后 写 到 文件 流 
中 ， 以 sep 分 割 ， end 结尾 。sep and end 都 必须 是 字符 串 形 式 的 ;也 可 以 留成 None, 这 样 会 
使 用 默认 值 。 如 果 没 有 打印 对 象 , print() 只 打印 一 个 结束 符号 end. 


file 参数 一 定 要 是 含有 write(string) 方 法 的 对 象 ;如 果 该 参数 为 空 ， 或 为 None, 默认 使 
用 sys.stdout 作为 输出 。 输 出 缓冲 方式 由 fe 决定 。 例 如 ， 使 用 file.flush() 来 确保 , 立即 显示 在 
屏幕 上 . 


Note 


This function is not normally available as a built-in since the name print is recognized as the 
print statement. 为 了 使 得 print 语 句 失效 ， 而 使 用 print) HR, 可 以 使 用 future 语句 在 你 的 模块 
上 面 : 


from _ future__ import print function 


2.6 hr Parse. 
property([fget[, fset[, fdel[, doc]]]]) 返回 新 式 类 (继承 自 object 的 类 ) 的 一 个 属性 。 


fget 是 用 于 获取 属性 值 的 玉 数 ， 类 似 地 fset 用 于 设置 属性 ，fqe/ 用 于 删除 属性 。 典 型 的 用 法 是 定 
义 一 个 托管 的 属性 : x : 


class C(object): 
def | init (self): 
self. x - None 


def getx(self): 
return self. x 
def setx(self, value): 
self. x - value 
def delx(self): 
del self. x 
X = property(getx, setx, delx, "I'm the 'x' property.") 
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如 果 给 出 qoc， 它 将 是 该 属性 的 文档 字符 串 。 否 则 ， 该 属性 将 拷贝 fget 的 文档 字符 串 〈 如 果 存 
在 ) 。 这 使 得 用 property() 作 为 装饰 器 创建 一 个 只 读 属性 非常 容易 : 


class Parrot(object): 
def | init (self): 
self. voltage - 100000 


property 

def voltage(self): 
"""Get the current voltage.""" 
return self. voltage 


将 voltage() 方 法 转换 为 一 个 与 只 读 属 性 具有 相同 名 称 的 获取 函数 。 


A property object has getter, setter, and deleter methods usable as decorators that create a 
copy of the property with the corresponding accessor function set to the decorated function. 
最 好 的 解释 就 是 使 用 一 个 例子 : 


class C(object): 
def | init (self): 
self. x - None 


property 

def x(self): 
UUM pai] the mye property.""" 
return self. x 


Qx.setter 
def x(self, value): 
self. x - value 


Qx.deleter 
def x(self): 
del self. x 
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The returned property also has the attributes fget, fset, and fdel corresponding to the 
constructor arguments. 


2.2hk Pare. 
2.5 版 中 的 变化 : 如 果 doc 没 有 给 出 则 使 用 fget 的 文档 字符 串 。 
2.6 版 中 的 变化 : 添加 getter、setter 和 deleter 属 性 。 


range(stop)range(start, stop[, step]) 这 是 一 个 创建 算术 级 数列 表 的 通用 函数 。 它 最 常用 于 for 
循环 。 参 数 必 须 为 普通 的 整数 。 如 果 step 参 数 省 略 ， 则 默认 为 1。 如 果 start 参 数 省 略 ， 则 默认 
为 0。 该 图 数 的 完整 形式 返回 一 个 整数 列表 [start,start+step,start+2step,...]。 如 果 step 为 正 ， 
则 最 后 一 个 元 素 starttistep 最 大 且 小 于 stop ; 如 果 step 为 负 ， 则 最 后 一 个 元 素 starttistep 最 小 
且 大 于 stop。step* 必 须 不 能 为 需 ( 否 则 会 引发 ValueError) 。 示 例 : 


>>> range(10) 

IO); a; 2, Sp 156 ty OI) 
>>> range(1, 11) 

lala 2, Sin ab. Sy Gp ep fp Bi, oN] 
>>> range(0, 30, 5) 

[0, 5, 10, 15, 20, 25] 

>>> range(0, 10, 3) 
[0735372672891] 

>>> range(0, -10, -1) 

[0, -1, -2, -3, -4, -5, -6, -7, -8, -9] 
>>> range(0) 


>>> range(1, 0) 


raw input([prompt]) 如 果 有 prompt 人 参数 ， 则 将 它 输出 到 标准 输出 且 不 带 换行 。 该 图 数 然 后 从 
标准 输入 读 取 一 行 ， 将 它 转换 成 一 个 字符 串 (去 掉 一 个 末尾 的 换行 符 ) ， 然 后 返回 它 。 当 读 
到 EOF 时 ， 则 引发 EOFError。 示 例 : 


>>> s = raw_input('--> ') 
--> Monty Python's Flying Circus 
>>> s 


"Monty Python's Flying Circus" 


如 果 已 经 加 载 readline 模 块 ， 那 么 raw_input() 闻 用 它 来 提供 优雅 的 行 编辑 和 历史 功能 。 


reduce(function, iterable[, initializer]) 将 带 有 两 个 参数 的 function 黑 计 地 应 用 到 iterable 的 元 素 
上 ， 从 左 向 右 ， 以 致 和 将 可 和 迭代 序列 reduce 为 一 个 单一 的 值 。 例 如 ，reduce(lambdax,y:x+y， 
[1,2,3,4,5]) 相 当 于 计算 ((((1+2)+3)+4)+5)。 左 边 的 参数 x 是 累计 之 后 的 值 ， 右 边 的 参数 y 是 来 自 


jterable 中 的 修改 值 。 如 果 提 供 可 选 的 参数 initializer， 它 在 计算 时 放 在 可 迭代 序列 的 最 前 面 ， 
并 且 当 可 和 迭代 序列 为 空 时 作为 默认 值 。 如 果 jpjitiajzer 没 有 给 出 ， 且 jiterable 只 包含 一 个 元 素 ， 
将 返回 第 一 个 元 素 。 大 致 等 同 于 : 


def reduce(function, iterable, initializer=None): 
it = iter(iterable) 
if initializer is None: 
try: 
initializer = next(it) 
except StopIteration: 
raise TypeError('reduce() of empty sequence with no initial value') 
accum_value = initializer 
for x in it: 
accum_value = function(accum_value, x) 
return accum_value 


reload(module) 重 载 之 前 已 经 引入 过 的 模块 .参数 必须 是 一 个 模型 对 象 ， 所 以 之 前 它 必 须 成 功 
导入 。 如 果 你 用 外 部 编辑 器 编辑 了 模型 的 源 文件 并 且 打 算 在 不 离开 python 解 释 器 的 情况 下 使 
用 模型 的 新 版 本 ，reload 将 非常 有 用 。 返 回 值 是 该 模块 对 象 (与 module 参 数 相同 ) 。 


当 执 行 reload(module) 时 : 


e python 模 型 的 代码 将 重新 编译 并 且 模 型 级 的 代码 会 重新 执行 ， 定 义 一 系列 对 象 ， 这 些 对 
象 的 名 字 和 模型 字典 中 的 名 字 相 关联 。 改 进 后 的 模型 的 init 函数 不 会 第 二 次 加 载 。 

e 跟 Python 其 他 对 象 一 样 ， 旧 的 对 象 只 有 在 他 们 的 引用 计数 将 为 0 的 时 候 被 系统 收回 。 

e 模型 命名 空间 中 的 名 字 自 动 升级 指向 新 的 或 者 修改 后 的 对 象 。 

e 对 旧 对 象 的 其 他 引用 (上 比如 模型 延展 的 命名 ) 不 会 连接 到 新 的 改进 对 象 。 每 一 个 命名 空 
间 在 被 请 求 的 时 候 ， 都 必须 更 新 。 


这 里 有 一 些 列 的 其 他 警告 : 


If a module is syntactically correct but its initialization fails, the first import statement for it 
does not bind its name locally, but does store a (partially initialized) module object in 
sys.modules. To reload the module you must first import it again (this will bind the name to 
the partially initialized module object) before you can reload() it. 


When a module is reloaded, its dictionary (containing the module’s global variables) is 
retained.Redefinitions of names will override the old definitions, so this is generally not a 
problem.If the new version of a module does not define a name that was defined by the old 
version, the old definition remains.This feature can be used to the module's advantage if it 
maintains a global table or cache of objects — with a try statement it can test for the table's 
presence and skip its initialization if desired: 


try: 
cache 

except NameError: 
cache = {} 


It is legal though generally not very useful to reload built-in or dynamically loaded modules, 
except for sys, main and builtin.In many cases, however, extension modules are not 
designed to be initialized more than once, and may fail in arbitrary ways when reloaded. 


If a module imports objects from another module using from ...import ..., calling reload() for 
the other module does not redefine the objects imported from it — one way around this is to 
re-execute the from statement, another is to use import and qualified names (module.name) 
instead. 


If a module instantiates instances of a class, reloading the module that defines the class 
does not affect the method definitions of the instances — they continue to use the old class 
definition. The same is true for derived classes. 


repr(object) 返回 某 个 对 象 可 打印 形式 的 字符 串 。 它 与 字符 串 转 换 式 〈 反 引号 ) 产生 的 值 相 
同 。 有 时 候 能 够 把 这 个 操作 作为 一 个 普通 的 函数 访问 非常 有 用 。For many types, this function 
makes an attempt to return a string that would yield an object with the same value when 
passed to eval(), otherwise the representation is a string enclosed in angle brackets that 
contains the name of the type of the object together with additional information often 
including the name and address of the object. 3€ PJ LMt Œ Lrepr()AiA Hi RWB at HX Hl 
的 返回 。 


reversed(seq) 返回 一 个 反 转 的 迭代 器 。seq 必 须 是 一 个 具有 reversed() 方法 或 支持 序列 协议 
的 对 象 (整数 参数 从 0 开始 的 len() 方 法 和 getitem() H) 。 


2.4 版 中 新 增 。 
2.6 版 中 的 变化 : 添加 可 以 编写 一 个 定制 的 reversed() 方 法 的 可 能 。 


round(number{, ndigits]) 返 点 型 近似 值 ， 保 留 小 数 点 后 ndigits ti. MRA 

B&ndigits, CRiAAS. me FA Values are rounded to the closest multiple of 10 

to the power minus ndigits;if two multiples are equally close, rounding is done away from 0 
(所 以 ， 例 如 ，round(0.5) 是 1.0 Hround(-0.5)#-1.0) 。 


Note 


浮 点 数 round() 的 行为 可 能 让 人 惊讶 ， 例 如 round(2.675,2) 给 出 的 是 2.67 而 不 是 期 望 的 2.68。 
这 不 是 一 个 错误 : 大 部 分 十 进 制 小 数 不 能 用 浮 点 数 精 确 表 示 ， 它 是 因为 这 样 的 一 个 事实 的 结 


果 。 更 多 信息 ， 请 参阅 Floating Point Arithmetic: Issues and Limitations. 


set([iterable]) 返回 一 个 新 的 set 对 象 ， 其 元 素 可 以 从 可 选 的 jiterable 获 得 。set 是 一 个 内 建 的 
类 。 关 于 该 类 的 文档 ， 请 参阅 set 和 集合 类 型 — set, frozenset, 


关于 其 它 容器 请 参阅 内 建 的 frozenset、list、tuple 和 dict 类 ， 还 有 collections 模 块 。 
2.4 版 中 新 增 。 


setattr(object, name, value) getattr() 的 相反 操作 。 参 数 是 一 个 对 象 、 一 个 字符 串 和 任何 一 个 
值 。 字 符 串 可 以 是 一 个 已 存在 属性 的 名 字 也 可 以 是 一 个 新 属性 的 名 字 。 该 函数 将 值 赋 值 给 属 
性 ， 只 要 对 象 允 许 。 例 如 ，setattr(x,foobar,123) 等 同 于 x.foobar=123。 


slice(stop)slice(start, stop[, step]) 返回 一 个 sWce 对 象 ， 表 示 由 索引 range(start,stop,step) 指 出 
的 集合 。 start 和 和 step 参数 默 认为 None。 切 片 对 象 具有 只 读 属 性 start、stop 和 step， 它 们 仅仅 
返回 参数 的 值 (或 者 它们 的 默认 值 ) 。 它 们 没有 其 他 显 式 的 函数 ; 它 是 它们 用 于 Numerical 
Python 和 其 它 第 三 方 扩展 。 在 使 用 扩展 的 索引 语法 时 同样 会 生成 切片 对 象 。 例 如 : 
a[start:stop:step] 或 af[start:stop,i]。 返 回 迭 代 器 的 另外 一 个 版 本 可 以 参阅 itertools.islice()。 


sorted(iterable[, cmp[, key[, reverse]]]) 依据 iterable 中 的 元 素 返 回 一 个 新 的 列表 。 


可 选 参 数 cmp、key 和 reverse 与 list.sort() 方 法 的 参数 含义 相同 (在 可 变 的 序列 类 型 一 节 描 


述 ) 。 


cmp 指 定 一 个 定制 化 的 带 有 两 个 参数 的 比较 画 数 〈 可 迭代 的 元 素 ) ， 它 应 该 根据 第 一 个 参数 是 
小 于 、 等 于 还 是 大 于 第 二 个 参数 返回 负数 、 规 或 者 正 数 : 


cmp=lambdax,y:cmp(x.lower(),y.lower())。 默 认 值 是 None。 


key 指 定 一 个 带 有 一 个 参数 的 范 数 ， 它 用 于 从 每 个 列表 元 素 选 择 一 个 比较 的 关键 字 : 
key=str.lower。 默 认 值 是 None (直接 比较 元 素 ) o 


reverse 是 一 个 布尔 值 。 如 果 设 置 为 True， 那 么 列表 元 素 以 反 向 比较 排序 。 


通常 情况 下 ，HKey 和 /reverse 转 换 处 理 比 指定 一 个 等 同 的 cmp 画 数 要 快 得 多 。 这 是 因为 cmp 为 每 
个 元 素 调 用 多 次 但 是 key 和 reverse 只 会 触摸 每 个 元 素 一 次 。 使 用 functools.cmp_to_key() 来 转 
IBN cmpH RM 7; keyER 2, 


关于 排序 的 实例 和 排序 的 简明 教程 ， 请 参阅 Sorting HowTo. 
2.4 版 中 新 增 。 
staticmethod(function) 返回 function 的 一 个 静态 方法 。 


静态 方法 不 接受 隐 式 的 第 一 个 参数 。 要 声明 静态 方法 ， 请 使 用 下 面 的 习惯 方式 : 


class C(object ) : 
@staticmethod 
def f(argi, arg2, ...): 


@staticmethod 形 式 是 一 个 函数 装饰 器 — 细节 请 参阅 函数 定义 中 画 数 定义 的 描述 。 


它 既 可 以 在 类 上 调用 (例如 C.f()) 也 可 以 在 实例 上 调用 (例如 C().f())) 。 除 了 它 的 类 型 ， 实 例 
其 他 的 内 容 都 被 忽略 。 


Python 中 的 静态 方法 类 似 于 Java 或 C++。 关 于 创建 类 构造 器 的 另外 一 种 方法 ， 请 参 


阅 classmethod()。 

更 多 关于 静态 方法 的 信息 ， 请 查看 标准 类 型 层次 中 标准 类 型 层次 的 文档 。 
2.2 版 中 新 增 。 

2.4 版 中 的 新 变化 : 添加 豆 数 装饰 器 语法 。 


str(object=") 返回 一 个 字符 串 ， 包 含 对 象 的 友好 的 可 打印 表示 形式 。 对 于 字符 串 ， 它 返回 字符 
串 本 身 。 与 repr(object) 的 区 别 是 str(object) 不 会 永远 试图 返回 一 个 eval() 可 接受 的 字符 串 ; 它 
的 目标 是 返回 一 个 可 打印 的 字符 串 。 如 果 没 有 给 出 参数 ， 则 返回 空 字符 串 "。 


关于 字符 串 更 多 的 信息 请 参阅 序列 类 型 一 str, unicode, list, tuple, bytearray, buffer, xrange, 
它 描述 序列 的 函数 〈 字 符 串 是 序列 的 一 种 ) ， 以 及 在 Siring Methods 一 节 中 描述 的 字符 串 自 
己 的 方法 。 若 要 输出 格式 化 的 字符 串 ， 请 使 用 模板 字符 串 或 在 字符 串 格 式 化 操作 一 节 中 描述 
的 % 操 作 符 。 另 外 可 参阅 字符 串 服务 一 节 。 另 请 参阅 Unicode()。 


sum(iterable[, start]) 将 start 以 及 iterable 的 元 素 从 左 向 右 相 加 并 返回 总 和 。 star 机 认为 
0。 iterable 的 元 素 通常 是 数字 ，start 值 不 允许 是 一 个 字符 串 。 


对 于 某 些 使 用 场景 ， 有 比 sum() 更 好 的 选择 。 连 接 字符 串 序 列 的 首选 和 快速 的 方式 是 调 
用 ".join(sequence)。 如 要 相 加 扩展 精度 的 浮 点 数 ， 请 参阅 math.fsum()。 若 要 连接 一 系列 的 可 
迭代 量 ， 可 以 考虑 使 用 itertools.chain()。 


2.3 版 中 新 增 。 


super(type[, object-or-type]) 返回 一 个 代理 对 象 ， 这 个 对 象 指 派 方法 给 一 个 父 类 或 者 同类 .这 对 
进入 类 中 被 覆盖 的 继承 方法 非常 有 用 。 搜 索 顺 序 和 getattr() 一 样 。 而 它 自己 的 类 型 则 被 忽 
略 。 


类 型 的 mro 方法 type 罗列 了 被 getattr() 和 super(). 用 来 搜索 顺序 的 解决 方法 。The attribute 
is dynamic and can change whenever the inheritance hierarchy is updated. 


If the second argument is omitted, the super object returned is unbound.If the second 
argument is an object, isinstance(obj,type) must be true.If the second argument is a type, 
issubclass(type2,type) must be true (this is useful for classmethods). 


Note 


super() only works for new-style classes. 


There are two typical use cases for super.In a class hierarchy with single inheritance, super 
can be used to refer to parent classes without naming them explicitly, thus making the code 
more maintainable. This use closely parallels the use of super in other programming 
languages. 


The second use case is to support cooperative multiple inheritance in a dynamic execution 
environment.This use case is unique to Python and is not found in statically compiled 
languages or languages that only support single inheritance. This makes it possible to 
implement “diamond diagrams” where multiple base classes implement the same 
method.Good design dictates that this method have the same calling signature in every case 
(because the order of calls is determined at runtime, because that order adapts to changes 
in the class hierarchy, and because that order can include sibling classes that are unknown 
prior to runtime). 


For both use cases, a typical superclass call looks like this: 


class C(B): 
def method(self, arg): 
super(C, self).method(arg) 


Note that super() is implemented as part of the binding process for explicit dotted attribute 
lookups such as super().getitem(name).It does so by implementing its own getattribute() 
method for searching classes in a predictable order that supports cooperative multiple 
inheritance.Accordingly, super() is undefined for implicit lookups using statements or 
operators such as super()[name]. 


Also note that super() is not limited to use inside methods.The two argument form specifies 
the arguments exactly and makes the appropriate references. 


For practical suggestions on how to design cooperative classes using super(), see guide to 
using super(). 


2.2 版 中 新 增 。 

tuple([iterable]) 返回 一 个 元 组 ， 其 元 素 及 顺序 和 与 iterable 的 元 素 相 同 。jterable 可 以 是 一 个 序 
列 、 支 持 和 迭代 操 作 的 容器 或 迭代 器 对 象 。 如 果 iterable 已 经 是 一 个 元 组 ， 它 将 被 原样 返回 。 例 
如 ，tuple('abc') 返 回 ('a','b','c')，tuple([1,2,3]) 返 回 (1,2,3)。 如 果 没 有 给 出 参数 ， 则 返回 一 个 空 
的 元 组 ()。 

tuple 是 一 个 不 可 变 序 列 类 型 ， 其 文档 在 序列 类 型 — str, unicode, list, tuple, bytearray, buffer, 
Xxrange。 关 于 其 它 容器 ， 请 参阅 内 建 的 dict、list 和 set 类 以 及 collections 模 块 。 


type(object)type(name, bases, dict) 只 有 一 个 参数 时 ， 返 回 object 的 类 型 。 返 回 值 是 一 个 类 型 
对 象 。 建 议 使 用 内 建 画 数 isinstance() 测 试 一 个 对 象 的 类 型 。 


带 有 三 个 参数 时 ， 返 回 一 个 新 的 类 型 对 象 。 它 本 质 上 是 class 语 句 的 动态 形式 。name 字 符 串 是 
类 的 名 字 且 将 成 为 name 属 性 ; bases 元 组 逐条 列举 基 类 并 成 为 bases 属 性 ; dct AEOS X 
体 定义 的 命名 空间 并 成 为 dict 属 性 。 例 如 ， 下 面 的 两 条 语句 创建 完全 相同 的 type 对 象 : 


>>> class X(object): 
a=1 


>>> X = type('X', (object,), dict(a=1)) 


版 本 2.2 中 新 增 。 


unichr(/) 返回 Unicode 码 为 整数 的 Unicode 字 符 。 例 如 ，unichr(97) 返 回 字符 串 wa'。 这 是 
Unicode 字 符 串 ord() 的 反 转 。 其 参数 合法 的 范围 取决 于 Python 是 如 何 配 置 的 — 它 可 以 是 UCS2 
[0..0xFFFF] 或 者 UCS4 [0..0x10FFFF]。 和 否则 引发 ValueError。 对 于 ASCII 和 8 比特 字符 串 ， 请 
参阅 chr()。 


2.0 版 中 新 增 。 


unicode(object-")unicode(object[, encoding[, errors]]) 使 用 下 面 的 一 种 模式 返回 object 的 
Unicode 版 字符 串 : 


If encoding and/or errors are given, unicode() will decode the object which can either be an 
8-bit string or a character buffer using the codec for encoding.The encoding parameter is a 
string giving the name of an encoding; if the encoding is not known, LookupError is 
raised.Error handling is done according to errors;this specifies the treatment of characters 
which are invalid in the input encoding.If errors is 'strict' (the default), a ValueError is raised 
on errors, while a value of ‘ignore’ causes errors to be silently ignored, and a value of 
‘replace’ causes the official Unicode replacement character, U+FFFD, to be used to replace 
input characters which cannot be decoded.See also the codecs module. 


If no optional parameters are given, unicode() will mimic the behaviour of str() except that it 
returns Unicode strings instead of 8-bit strings.More precisely, if object is a Unicode string or 
subclass it will return that Unicode string without any additional decoding applied. 


For objects which provide a unicode() method, it will call this method without arguments to 
create a Unicode string.For all other objects, the 8-bit string version or representation is 
requested and then converted to a Unicode string using the codec for the default encoding in 
‘strict’ mode. 


For more information on Unicode strings see Sequence Types — str, unicode, list, tuple, 
bytearray, buffer, xrange which describes sequence functionality (Unicode strings are 
sequences), and also the string-specific methods described in the String Methods section.To 
output formatted strings use template strings or the % operator described in the String 
Formatting Operations section.In addition see the String Services section.See also str(). 


2.0hk Parse. 
2.2 版 中 的 变化 : Support for unicode() added. 
vars([object]) 返回 模块 、 类 、 实 例 或 其 它 任何 具有 dict 属 性 的 对 象 的 dict 属 性 。 


模块 和 实例 这 样 的 对 象 具有 可 更 新 的 dict 属 性 ; 然而 ， 其 它 对 象 可 能 对 它们 的 dict 属 性 具有 写 
限制 (例如 ， 新 式 类 使 用 dictproxy 来 防止 直接 的 字典 更 新 ) 。 


如 果 不 带 参数 ， 则 vars() 的 行为 类 似 locals()。 注 意 ， 局 部 字典 只 用 于 读 取 因为 对 局 部 字典 的 更 
新 被 忽略 。 


xrange(stop)xrange(start, stop[, step]) 该 范 数 与 range() 非 常 相似 ， 但 是 它 返 回 一 个 xrange 对 
象 而 不 是 一 个 列表 。 这 是 一 个 惰性 的 序列 类 型 ， 它 生成 与 对 应 的 列表 相同 的 值 但 不 会 真正 同 
时 一 起 存储 它们 。xrange() 相 比 range() 的 优点 不 大 (因为 xrange() 仍 然 必须 创建 需要 的 值 ) , 
除非 在 内 存 紧 张 的 机 器 上 使 用 一 个 非常 大 的 range 或 者 range 的 所 有 元 素 从 不 会 使 用 (例如 当 
循环 经 常 被 break 终 止 ) 。 关 于 xrange 对 象 的 更 多 对 象 ， 请 参阅 XRange 类 型 和 序列 类 型 一 
str, unicode, list, tuple, bytearray, buffer, xrange。 


CPython sia : xrange() 的 设计 意图 是 简单 而 快速 。 具 体 的 实现 可 能 强加 各 种 限制 以 实现 
这 点 。Python 的 C 实 现 限制 所 有 的 参数 为 C 的 原生 长 整 型 (Python 的 “ 短 " 整 数 ) ， 且 要 求 元 素 
的 个 数 适合 一 个 C 的 原生 长 整 型 。 如 果 需 要 一 个 更 大 的 range， 可 以 使 用 itertools 模 块 创建 一 个 
另外 的 版 本 : islice(count(start,step),(stop-starttstep-1+2*(step<0))//step)。 


zip([/terable, …]) 该 图 数 返回 一 个 元 组 的 列表 ， 其 中 第 /个 元 组 包含 每 个 参数 序列 的 第 /个 元 素 。 
返回 的 列表 长 度 被 截断 为 最 短 的 参数 序列 的 长 度 。 当 多 个 参数 都 具有 相同 的 长 度 时 ，zip() 类 
似 于 带 有 一 个 初始 参数 为 None 的 map()。 只 有 一 个 序列 参数 时 ， 它 返回 一 个 1 元 组 的 列表 。 没 
有 参数 时 ， 它 返回 一 个 空 的 列表 。 


可 以 保证 迭代 按 从 左 向 右 的 计算 顺序 。 这 使 得 使 用 zip(/iter(s)Jn) 来 将 一 系列 数据 分 类 轨 并 为 长 
度 为 n 的 组 成 为 习惯 用 法 。 


zip() 与 * 操作 符 一 起 可 以 用 来 unzip 一 个 列表 : 


>>> x = [1, 2, 3] 

>>> y = [4，5，6] 

>>> zipped = zip(x, y) 

>>> zipped 

[(1, 4), (2, 5), (3, 6)] 

>>> x2, y2 = zip(*zipped) 

>>> x == list(x2) and y == list(y2) 
True 


版 本 2.0 中 新 增 。 
2.4 版 中 的 变化 : 以 前 ，zip() 要 求 至 少 一 个 参数 ， 且 zip() 将 引发 TypeError 而 不 是 一 个 空 序列 。 


import(name[, globals|, locals[, fromlist[, lever]]]]) 
注意 


与 importlib.import_module() 不 同 ， 这 是 一 个 高 级 的 函数 ， 不 会 在 日 常 的 Python 变 成 中 用 


到 ，。 


This function is invoked by the import statement.It can be replaced (by importing the builtin 
module and assigning to builtin.import) in order to change semantics of the import 
statement, but nowadays it is usually simpler to use import hooks (see PEP 302).Direct use 
of import() is rare, except in cases where you want to import a module whose name is only 
known at runtime. 


The function imports the module name, potentially using the given globals and locals to 
determine how to interpret the name in a package context.The fromlist gives the names of 
objects or submodules that should be imported from the module given by name.The 
standard implementation does not use its /oca/s argument at all, and uses its globals only to 
determine the package context of the import statement. 


level specifies whether to use absolute or relative imports.The default is -1 which indicates 
both absolute and relative imports will be attempted.0 means only perform absolute 
imports.Positive values for level indicate the number of parent directories to search relative 
to the directory of the module calling import(). 


When the name variable is of the form package.module, normally, the top-level package (the 
name up till the first dot) is returned, not the module named by name.However, when a non- 
empty fromlist argument is given, the module named by name is returned. 


For example, the statement importspam results in bytecode resembling the following code: 


spam - import ('spam', globals(), locals(), [], -1) 


The statement importspam.ham results in this call: 


spam = import ('spam.ham', globals(), locals(), [], -1) 


Note how import() returns the toplevel module here because this is the object that is bound 
to a name by the import statement. 


On the other hand, the statement fromspam.hamimporteggs,sausageassaus results in 


_temp = |J import ('spam.ham', globals(), locals(), ['eggs', 'sausage'], -1) 


eggs - temp.eggs 
saus - temp.sausage 


Here, the spam.ham module is returned from import().From this object, the names to import 
are retrieved and assigned to their respective names. 


如 果 你 只 是 简单 地 想 依据 名 字 导 入 一 个 模块 ， 请 使 用 mportlib.import_module()。 
2.5 版 中 的 变化 : 添加 level 参 数 。 
2.5 版 中 的 变化 : 添加 关键 字 参 数 的 支持 。 


3. TK ER EPI PI EE E ZI 


有 几 个 内 建 的 函数 在 现代 Python 编程 中 已 经 没有 必要 再 学 习 、 知 道 和 使 用 了 。 这 里 保留 它们 
是 为 了 保持 为 老 版 本 Python 编写 的 程序 的 向 后 兼容 。 


Python 程 序 员 、 培 训 人 员 、 学 生 以 及 书籍 编写 人 员 应 该 自由 跳 过 这 些 副 数 而 不 用 担心 遗漏 重 
要 的 内 容 。 


apply(function, args[, keywords]) The function argument must be a callable object (a user- 
defined or built-in function or method, or a class object) and the args argument must be a 
sequence. The function is called with args as the argument list;the number of arguments is 
the length of the tuple.If the optional keywords argument is present, it must be a dictionary 
whose keys are strings.It specifies keyword arguments to be added to the end of the 
argument list.Calling apply() is different from just calling function(args), since in that case 
there is always exactly one argument.The use of apply() is equivalent to 

function(args, *keywords). 


自 2.3 版 后 废弃 : 使 用 function(args, **keywords) %48 & apply(function,args,keywords) (参见 
[Unpacking Argument Lists*](#)) 。 


buffer(object[, offset[, size]]) object 参 数 必须 是 一 个 支持 缓冲 区 调用 接口 的 对 象 (例如 字符 
串 、 数 组 和 缓冲 区 ) 。 将 创建 一 个 新 的 引用 object 参 数 的 缓冲 区 对 象 。 缓 冲 区 对 象 业 是 一 个 从 
object 的 起 点 开始 的 切片 (或 者 从 指定 的 offset) 。 切 片 将 扩展 到 object 对 象 的 末尾 (或 者 通过 
Size 参 数 指定 的 长 度 ) 。 


coerce(x, y) Return a tuple consisting of the two numeric arguments converted to a common 
type, using the same rules as used by arithmetic operations.If coercion is not possible, raise 
TypeError. 


intern(string) Enter string in the table of “interned” strings and return the interned string — 
which is string itself or a copy.Interning strings is useful to gain a little performance on 
dictionary lookup — if the keys in a dictionary are interned, and the lookup key is interned, the 
key comparisons (after hashing) can be done by a pointer compare instead of a string 
compare.Normally, the names used in Python programs are automatically interned, and the 
dictionaries used to hold module, class or instance attributes have interned keys. 


2.3 版 中 的 变化 : Interned strings are not immortal (like they used to be in Python 2.2 and 
before);you must keep a reference to the return value of intern() around to benefit from it. 


脚注 


[1] 它 极 少 被 使 用 ， 所 以 不 应 该 成 为 语句 。 


当前 在 没有 setvbuf() 的 系统 上 指明 缓冲 大 小 是 没有 效果 的 。 该 接口 指明 缓冲 大 小 不 
[2] 是 通过 调用 setvbuf() 本 数 来 实现 的 ， 因 为 在 执行 任意 的 WO 操作 后 再 调用 该 函数 可 
能 会 导致 内 存 转 储 ， 同 时 也 没有 一 个 可 靠 的 方法 来 判断 这 种 情况 。 


| [3] | In the current implementation, local variable bindings cannot normally be affected this 
way, but variables retrieved from other scopes (such as modules) can be.This may change. | 


4. 内 建 的 常量 

内 置 的 命名 空间 中 存在 少数 几 个 常量 。 它 们 是 : 
False bool 类 型 值 false。 

版 本 2.3 中 新 增 。 

True bool 类 型 值 true。 

版 本 2.3 中 新 增 。 


None types.NoneType 的 唯一 值 。None 常 用 来 表示 人 缺少 的 值 ， 例 如 当 默 认 参 数 没有 传递 给 画 
数 时 。 


2.4 版 本 中 的 更 改 : 对 None 赋 值 变 成 非法 且 引 发 SyntaxError。 


Notlmplemented 它 可 以 由 特殊 的 "rich comparison"753& (eq()，It() 以 及 类 似 的 方法 ) 返回 ， 
以 指示 另 一 种 类 型 没有 实现 这 种 比较 操作 。 


Ellipsis 与 扩展 的 切片 语法 一 起 使 用 的 特殊 值 。 

debug 如 果 Python 没 有 以 -O 选 项 启动 则 该 常量 为 真 。 另 请 参阅 assert 语 句 。 

注 

None 和 debug 的 名 称 不 能 重新 赋值 〈 如 果 对 它们 赋值 ， 即 使 作为 一 个 属性 名 称 ， 也 会 引发 
SyntaxError) ， 所 以 它们 可 以 被 认为 是 "真实 "的 常量 。 


2.7 版 本 中 的 更 改 : 将 debug 作 为 一 个 属性 来 赋值 变 成 非法 。 


4.1. site 模 块 添加 的 前 数 


site 模 块 〈 在 启动 期 间 自 动 导 人 ， 除 非 给 出 -S 命 令 行 选项 ) 将 添加 几 个 常数 到 内 置 的 命名 空 
间 。 它 们 可 用 于 交互 式 解释 器 的 shell， 不 应 在 程序 中 使 用 。 


quit([code=None])exit([code=None]) 当 打印 这 两 个 对 象 时 打印 一 条 类 似 ("Use quit() or Ctrl-D 
(i.e. EOF) to exit") 的 信息 ， 当 它们 被 调用 时 则 使 用 指定 的 退出 码 引 发 SystemExit 。 


copyrightlicensecredits 当 打 印 这 两 个 对 象 时 打印 一 条 类 似 ("Type license() to see the full 
license text") 的 信息 ， 当 它们 被 调用 时 则 以 分 页 显示 相应 的 文本 。 


5. 内 建 的 类 型 
以 下 各 节 描 述 内 置 于 解释 器 的 标准 关 型 。 
注 


历史 上 (直到 2.2 版 的 发 布 ) ，Python 的 内 置 类 型 不 同 于 用 户 定义 的 类 型 ， 因 为 不 可 能 用 内 和 置 
类 型 作为 面向 对 象 继承 的 基 类 。 这 种 限制 不 再 存在 。 


主要 的 内 置 类 型 为 数字 、 序列 、 映射 、 文件 、 类 、 实例 和 异常 。 

某 些 操作 被 几 种 对 象 类 型 支持 ; 特别 需要 注意 的 是 ， 几 乎 所 有 对 象 都 可 以 比较 、 测 试 真 值 、 
转换 为 字符 串 (其 实 就 是 用 repr() 范 数 ， 或 略 有 差异 的 str() 范 数 来 转换 ) 。 后 者 在 对 象 使 
用 print() 范 数 写 出 时 隐 式 地 调用 。 

5.1. 真 值 的 测试 


任何 对 象 都 可 以 测试 真 值 ， 用 于 if 或 while 的 条 件 或 下 面 布 尔 运算 的 操作 数 。 下 面 的 值 被 视 为 
(FR : 


e None 

e False 

。 任何 数值 类 型 的 需 ， 例 如 ,0、0L、0.0、 Oj 
e 任何 空 的 序列 ， 例 如 ，"、 ()、 Oe 

e 任何 空 的 映射 ， 例 如 ，1}。 


e 用户 定义 的 类 的 实例 ， 如 果 该 类 定义 一 个 nonzerol) 或 len() 的 方法 ， 在 该 方法 返回 整数 需 
或 布尔 值 False 时 。[1] 


所 有 其 他 值 都 被 视 为 真一 所 以 许多 类 型 的 对 象 永远 为 真 。 

结果 为 布尔 值 的 运算 和 内 建 函 数 总 是 返回 0 或 False 表 示 假 以 及 1 或 True 表示 真 ， 除 非 另 有 说 
明 。 (重要 的 例外 : 布尔 操作 符 or 和 and 始 终 返 回 它们 的 一 个 操作 数 。) 

2. 布尔 操作 — and, or, not 


这 些 是 布尔 操作 ， 按 升序 优先 排序 : 


操作 结果 注 


xory 如 果 x 为 假 ， 那 么 返回 y， 否 则 返回 x (1) 
xandy 如 果 x 为 假 ， 那 么 返回 x， 否 则 返回 y (2) 
notx 如 果 x 为 假 ， 那 么 返回 True， 否 则 返回 False (3) 


1. 这 是 一 个 短路 操作 符 ， 因 此 只 有 第 一 个 参数 为 False 时 才 计 算 第 二 个 参数 。 
2. 这 是 一 个 短路 操作 符 ， 因 此 只 有 第 一 个 参数 为 True 时 才 计 算 第 二 个 参数 。 
3. not 比 非 布尔 操作 符 的 优先 级 低 ， 因 此 nota==b 解 释 为 not(a==b)，a==notb 是 一 个 语法 错 


误 。 


5.3. 比较 操作 


所 有 对 象 都 支持 比较 操作 。 它 们 都 具有 相同 的 优先 级 (高 于 布尔 操作 ) 。 比 较 可 以 任意 链 
f; 例如 ，x<y< =z 相 当 于 x<yandy< =z， 只 是 y 只 计算 一 次 (但 这 两 种 情况 在 x<y 是 假 时 都 不 
会 计算 z) 。 


下 表 汇 总 了 比较 操作 : 
操作 含义 注 
5 严格 地 小 于 
Es 小 于 或 等 于 
> 严格 地 大 于 
am 大 于 或 等 于 
== 等 于 
= 不 等 于 (1) 
is 对 象 的 ID 
isnot 不 同 的 对 象 ID 


1，!= 也 可 以 写成 <>， 但 这 只 是 用 于 保持 向 后 兼容 性 的 用 法 。 新 的 代码 应 该 一 直 使 用 !=。 


不 同类 型 的 对 象 ， 不 同 的 数值 和 字符 串 类 型 除外 ， 比 较 结果 永远 不 会 相等 ; 这 类 对 象 排序 的 
结果 永远 一 致 但 是 顺序 却 是 随机 的 (使 得 异 构 数组 的 排序 可 以 生成 一 致 的 结果 ) 。 此 外 ， 某 
些 类 型 (例如 ， 文 件 对 象 ) 只 支持 退化 的 比较 概念 ， 该 类 型 的 任何 两 个 对 象 都 不 相等 。 同 
样 ， 这 类 对 象 排序 的 顺序 是 随机 的 但 是 会 永远 是 一 致 的 。 当 任何 一 个 操作 数 是 复数 时 ，<、 
=, > 和 > = 运算 符 会 引发 TypeError 异 常 。 


类 的 非 同一 个 实例 比较 时 通常 不 相等 ， 除 非 该 类 定义 eq() 或 cmp() 方 法 。 


一 个 类 的 实例 通常 不 能 与 同一 个 类 的 其 它 实例 或 者 其 他 类 型 的 对 象 排序 ， 除 非 该 类 定义 足够 
丰富 的 比较 方法 (ge()、le()、 gti. It)) 或 cmp() 方 法 。 


CPython 的 实现 细节 : 除数 值 以 外 不 同类 型 的 对 象 按 它们 的 类 型 名 称 进 行 排序 ; 不 支持 合适 
比较 的 相同 类 型 的 对 象 按 它们 的 地 址 进行 排序 。 


还 有 两 个 具有 相同 优先 级 的 操作 in 和 notin 只 支持 序列 类 型 ( 见 下 文 )。 


5.4. 数值 类 型 — int, float, long, complex 


有 四 种 不 同 的 数值 类 型 : 普通 整数 、 长 整数 、 浮 点 数 和 复数 。 此 外 ， 布 尔 值 是 普通 整数 的 一 
个 子 类 型 。 普 通 整数 (也 被 只 叫做 整数 ) 使 用 C 中 的 long 实 现 ， pe 
(sys.maxint 始 终 设置 为 当前 平台 最 大 的 普通 整数 值 ， 最 小 值 是 -sys.maxint-1)。 长 整数 具有 
无 限 的 精度 。 浮 点 数字 通常 使 用 C 中 的 double 实 现 ; 有 关 你 的 程序 所 运行 的 机 器 上 的 浮 点 数 精 
度 及 其 内 部 表示 形式 的 信息 在 sys.float_info 中 可 以 获得 。 复 数 有 实 部 和 虚 部 ， 各 是 一 个 浮 点 
数 。 若 要 从 复数 z 中 提取 这 些 部 分 ， 请 使 用 z.real 和 z.imag。 (标准 库 包括 额外 的 数值 类 

型 ，fractions 支 持 有 理 数 ，decimal 支 持 用 户 自 定义 精度 的 浮 点 数 。) 


数值 通过 数字 字面 值 或 内 建 的 函数 和 操作 的 结果 创建 。 普 通 的 整数 字面 值 (包括 二 进 制 、 十 
六 进 制 和 八进制 数字 ) 产生 普通 整数 ， 除 非 它们 指定 的 值 太 大 以 致 不 能 用 一 个 普通 的 整数 表 
示 ， 在 这 种 情况 下 它们 产生 一 个 长 整 型 。 带 有 'L' 或 后 级 的 整数 字面 值 产生 长 整数 (偏向 使 
用 'L'， 因 为 1 看 起 来 太 像 十 一 ) 。 包 含 小 数 点 或 指数 符号 的 数字 字面 值 产生 浮 点 数 。 

将 i 或 J 附加 到 数字 字面 值 的 尾部 产生 实 部 为 堆 的 复数 。 复 数字 面值 是 实 部 和 虚 部 的 和 。 
Python 完全 支持 混合 的 算法 : 当 二 元 算术 运算 符 的 操作 数 是 不 同 的 数值 类 型 时 ,“ 较 窄 "类 型 的 
操作 数 会 拓宽 成 另外 一 个 操作 数 的 类 型 ， 其 中 整数 罕 于 长 整数 窒 于 浮 点 数 窒 于 复数 。 比 较 混 


合 型 数字 之 间 使 用 相同 的 规则 。[2] 构 造 画 数 int()、long()、float() 和 complex() 可 用 于 产生 的 一 
种 特定 类 型 的 数值 。 


所 有 内 置 的 数值 类 型 都 支持 以 下 操作 。 运 算 符 的 优先 级 请 参阅 寞 运算 符 和 后 面 几 节 。 


操作 结果 注 

x+y X 与 y 和 
X-y X 与 y 的 差 
x*y x5 yl) s. 
xly x 与 y 的 商 (1) 
x/ly xSyh (BR) 商 (4)(5) 
x%y x/y 的 余数 (4) 
-X fx 
+x X 保 持 不 变 
abs(x) X 的 绝对 值 或 大 小 (3) 
int(x) X 转 换 成 整数 (2) 
long(x) X 转 换 成 长 整数 (2) 
float(x) X 转 换 成 浮 点 数 (6) 
complex(re,im) 实 部 为 re， 虚 部 为 jim 的 一 个 复数 。im 默 认为 需 。 
c.conjugate() Fichi (用 实数 表示 ) 
divmod(x,y) 元 组 (x//y,x%y) (3)(4) 
pow(x,y) x 的 y 次 方 (3)(7) 
x**y X 的 y 次 方 (7) 

注 : 


1. tF (HERK) 整数 除法 ， 结 果 是 一 个 整数 。 结 果 总 是 向 负 无 穷 舍 入 : 1/2 是 0，(-1)/2 
是 -1，1/(-2) 是 -1，(-1)/(-2) 是 0。 请 注意 如 果 任 何 一 TUER 结果 都 会 是 一 个 
长 整数 ， 与 值 大 小 无 关 。 


2. 使 用 int() 或 long() 画 数 转换 浮 点 数 会 向 需 截 断 ， 类 似 相关 的 函数 math.trunc() 画 数 。 使 用 函 
数 math.floor() 以 向 下 取 整 和 math.ceil() 以 向 上 取 整 。 


3. 完整 的 说 明 请 参阅 内 置 西数 。 


4.， 从 2.3 版 开始 弃 用 : 整除 运算 符 、 取 模 运 算 符 和 divmod() 函 数 不 再 为 复数 定义 。 相 反 ， 如 
果 合适 ， 可 以 使 用 abs() 画 数 转换 为 浮 点 数 。 


5. 也 被 称 为 整数 除法 。 结 果 的 值 完全 是 一 个 整数 ， 虽 然 结果 的 类 型 不 一 定 是 整 型 。 
6. 浮 点 数 还 接受 可 带 有 可 选 "+" 或 "-" 的 字符 串 "nan" 和 "inf" 来 表示 非 数字 (NaN)) 和 正 / 
负 无 穷 。 


在 2.6 版 中 新 增 。 


1，Python 定 义 pow(0,0) 和 0**0 为 1， 这 对 于 编程 语言 很 常见 。 
所 有 的 numbers.Real 类 型 (int、long 和 float) 还 包含 以 下 的 操作 : 


操作 
math.trunc(x) x 截取 成 整数 
round(x[,n]) x 舍 入 到 n 位 ， 舍 入 ties away from 需 。 如 果 n 省 略 ， 默 认为 0。 
math.floor(x) <= x 的 最 大 浮 点 整数 


math.ceil(x) >= x 的 最 小 浮 点 整数 


OH 


AR X 


6. 内 建 的 异种 


异常 应 该 是 类 对 象 。 异 常 定义 在 模块 exceptions 中 。 该 模块 不 需要 显 式 导 入 : 这 些 异 常 在 内 置 
命名 空间 中 有 提供 ， 就 和 exceptions 模 块 一 样 。 


对 于 类 异常 ， 如 果 在 try 语 句 的 except 子 句 中 提 到 一 个 类 ， 该 子 句 还 会 处 理 任何 从 那个 类 派生 
的 异常 类 (不 是 它 派生 自 的 异常 类 ) 。 通 过 子 类 化 得 到 的 两 个 不 相关 的 异常 类 永远 不 会 相 
等 ， 即 使 它们 具有 相同 的 名 称 。 

下 面 列 出 的 异常 可 以 通过 解释 器 或 内 置 函 数 生 成 。 除 了 提 到 的 那些 地 方 ， 它 们 还 有 "相关 联 的 
值 " 指 示 错 误 的 详细 的 原因 。 它 可 能 是 一 个 字符 串 或 一 个 包含 几 项 信息 〈 例 如 ， 错 误 码 和 解释 
代码 的 字符 串 ) 的 元 组 。 关 联 的 值 为 raise 语 句 的 第 二 个 参数 。 如 果 异 常 类 派生 自 标准 的 根 
类 BaseException， 关 联 的 值 作为 异常 实例 的 args 属 性 呈现 。 

用 户 代码 可 以 引发 内 置 异常 。 这 可 以 用 来 测试 异常 处 理 程序 或 报告 一 个 错误 情况 ，" 就 像 "这 种 
情况 下 解释 器 引起 的 相同 异常 ; 但 要 注意 没有 办 法 能 阻止 用 户 代码 引发 一 个 不 当 的 错误 。 

内 置 的 异常 类 可 以 创建 子 类 来 定义 新 的 异常 ; 程序 员 应 该 从 Exception 类 或 它 的 一 个 子 类 而 不 
是 从 BaseException 派 生 新 的 异常 。 有 关 定 义 异常 详细 信息 可 以 访问 Python 教程 中 的 用 户 定 
义 的 异常 。 

以 下 的 异常 只 用 作 其 它 异 常 的 基 类 。 

exceptionBaseException 所 有 内 建 的 异常 的 基 类 。 它 并 不 意味 用 户 定义 的 类 应 该 直接 继承 它 
(为 此 ， 请 使 用 Exception) 。 如 果 在 该 类 的 一 个 实例 上 调用 sitr() 或 unicode()， 则 返回 该 实例 
的 参数 的 表示 ， 没 有 参数 时 返回 空 字 符 串 。 


版 本 2.5 中 新 增 。 


args 异常 构造 图 数 的 参数 元 组 。 有 些 内 建 的 异常 (如 IOError) 期 望 一 定数 量 的 参数 并 为 此 元 
组 的 元 素 分 配 特 殊 的 含义 ， 而 其 它 异常 的 调用 通常 只 需要 一 个 单一 的 字符 串 来 提供 一 条 错误 
消息 。 


exceptionException 所 有 内 置 的 、 非 系统 退出 异常 是 从 该 类 派生 的 。 此 外 应 该 从 该 类 派生 所 
有 用 户 定义 的 异常 。 


2.5 版 本 中 的 更 改 : 更 改 为 从 BaseException 继 承 。 


exceptionStandardError 除 Stoplteration、GeneratorExit、Keyboardlnterrupt 和 SystemExit 以 
外 的 所 有 内 置 异常 的 基 类 。StandardError 本 身 继承 自 Exception。 


exceptionArithmeticError 各 种 算术 错误 引发 的 内 置 异常 的 基 
类 : OverflowError、ZeroDivisionError、FloatingPointError。 


exceptionBufferError 当 缓 冲 区 相关 的 操作 无 法 执行 时 引发 。 


exceptionLookupError 当 用 于 映射 或 序列 的 键 或 索引 无 效 时 引发 的 异常 的 基 
X : IndexError、KeyError。 可 以 直接 通过 codecs.lookup() 引 发 。 


exceptionEnvironmentError Python 系统 以 外 发 生 的 异常 的 基 类 : IOError、OSError。 当 用 2 
元 组 创建 这 种 类 型 的 异常 时 ， 第 一 项 可 以 通过 实例 的 errno 属 性 访问 〈 它 被 假设 为 一 个 错误 编 
号 ) ， 第 二 个 项 目 是 可 通过 strerror 属 性 访问 〈 它 通常 与 错误 消息 关联 ) 。 元 组 本 身 也 是 可 用 
的 args 属 性 上 的 。 


1.5.2 版 中 新 增 。 


EnvironmentError 异 常 以 3 元 组 实例 化 时 ， 前 两 项 的 访问 和 上 面 一 样 ， 第 三 项 可 以 通过 
filename 属 性 访问 。 然 而 ， 对 于 向 后 兼容 性 ， args 属 性 包含 仅 2 元 第 一 次 的 两 个 构造 画 数 参 
数 。 


当 该 异常 以 非 3 个 参数 创建 时 ，filename 属 性 为 None。 当 实例 不 是 以 2 个 或 3 个 参数 创建 
时 ，errno 和 strerror 属 性 也 为 None。 在 最 后 一 种 情况 下 ， args 以 一 个 元 组 的 形式 包含 构造 画 
数 的 原样 参数 。 


以 下 是 实际 中 会 引发 的 异常 。 
exceptionAssertionError 当 assert 语 句 将 失败 时 引发 。 


exceptionAttributeError 当 属 性 引用 (请 参见 属性 引用 ) 或 分 配 失败 。 ( 当 对 象 不 支持 属性 
引用 或 根本 属性 分 配 时 ， TypeError 将 引发 。) 


exceptionEOFError 当 (input () 或 raw_input()) 的 内 置 函 数 之 一 点 击 文件 结尾 (EOF) RTF 
没有 读 取 任 何 数据 时 引发 。 ( 注 : file.read() 和 file.readline() 的 方法 返回 一 个 空 字符 串 ， 当 他 
们 击 中 EOF, ) 


exceptionFloatingPointError 提出 当 浮 动 点 操作 将 失败 。 此 异常 其 始终 定义 ， 但 可 以 当 
Python 配置 与 时 的 情况 下 ， 才 会 引发 一 一 fpect| 与 选项 或 WANT_SIGFPE_HANDLER 符 号 
在 pyconfig.h 文 件 中 定义 。 


exceptionGeneratorExit 当 调 用 一 种 发 电机 的 close () 方 法 时 引发 。 它 直接 继承 而 不 
是 StandardErrorBaseException ， 因 为 它 是 从 技术 上 讲 不 是 一 个 错误 。 


新 版 本 2.5 中 的 。 
2.6 版 本 中 的 更 改 : 更 改 为 从 BaseException 继 承 。 


exceptionlOError O 相关 的 原因 ， 例 如 ，" 未 找到 文件 "或 " 磁 胡 已 满 " print, 内 置 open 
() 画 数 或 文件 对 象 的 方法 ) 的 VO 操作 失败 时 引发 。 


此 类 是 从 EnvironmentError 派 生 的 。 异 常 实例 属性 请 参阅 上 文 讨论 的 详细 信息 。 


2.6 版 本 中 的 更 改 : 改变 socket.error 把 此 作为 基 类 。 


exceptionlmportError 当 import 语 句 无 法 找到 模块 定义 或 者 时 从 .…. 引 发 导 人 未 能 找到 要 导入 
的 名 称 。 


exceptionlndexError 序列 下 标 超出 范围 时 引发 。 (切片 索引 会 被 自动 截断 落 在 允许 的 范围 内 
; 如 果 索 引 不 是 一 个 普通 整数 ， 则 引发 TypeError ) o 


exceptionKeyError 在 现 有 的 键 的 集合 中 找 不 到 GAA) 的 映射 键 时 引发 。 


exceptionKeyboardinterrupt 当 用 户 点 击 中 断 键 (通常 控制 C 或 删除 ) 时 引发 。 在 执行 期 
闻 ， 从 理论 上 进行 定期 检查 的 中 断 。 中 断 类 型 ， 当 一 个 内 置 函 数 的 input () 或 raw_input() 等 待 
输入 还 引发 此 异常 。 异 常 继承 BaseException ， 不 意外 地 被 捕获 的 异常 的 代码 捕捉 ， 从 而 防 
止 该 解释 器 退出 。 

2.5 版 本 中 的 更 改 : 更 改 为 从 BaseException 继 承 。 

exceptionMemoryError 当 操 作 耗 尽 了 内 存 ， 但 情况 仍 可 能 获救 〈 通 过 删除 一 些 对 象 ) 时 引 
发 。 关 联 的 值 是 一 个 字符 串 ， 指 示 什 么 样 的 (内 部 ) 操作 耗 尽 了 内 存 。 请 注意 由 于 底层 内 存 


管理 结构 (C 的 malloc (WX) ， 口 译员 未 必 能 够 完全 恢复 从 这 种 情况 ; 它 然而 引发 异常 以 
便 可 以 打印 堆栈 回溯 ， 离 家 出 走 的 程序 今 的 情况 下 。 


exceptionNameError 当 找 不 到 本 地 或 全 局 名 称 时 引发 。 这 仅 适 用 于 不 合格 的 名 称 。 关 联 的 值 
是 一 条 错误 消息 ， 其 中 包括 找 不 到 的 名 称 。 

exceptionNotImplementedError 此 异常 是 从 RuntimeError 派 生 的 。 用 户 定 义 基 类 中 抽象 方法 
应 引发 异常 ， 当 他 们 要 求 派生 的 类 重 写 该 方法 。 

在 1.5.2 版 本 新 。 

exceptionOSError 此 异常 是 从 EnvironmentError 派 生 的 。 它 被 提出 当 一 个 男 数 返回 与 系统 相 
关 的 错误 (不 是 非法 的 参数 类 型 或 其 他 附带 的 错误 ) 。Errno 属 性 是 从 errno， 一 个 数字 错误 
代码 ， strerror 属 性 是 相应 的 字符 串 ， 将 印 的 C BRoXXperror ()。 请 参阅 模块 errno， 其 中 包含 由 
底层 操作 系统 定义 的 错误 代码 的 名 称 。 


对 于 涉及 (如 chdir() 或 作用 是 : ) 的 文件 系统 路 径 的 有 异常， 异常 实例 将 包含 三 个 属性 ， 文 件 
名 ， 这 是 传递 给 范 数 的 文件 的 名 称 。 


在 1.5.2 版 本 新 。 


exceptionOverflowError 太 大 而 无 法 表示 算术 运算 的 结果 时 引发 。 长 整数 (这 上 比 放 弃 ， 而 是 
会 引起 MemoryError )， 和 与 普通 的 整数 ， 而 是 返回 一 个 长 整数 的 大 多 数 操作 ， 就 不 能 发 生 这 种 
情况 。 缺 乏 标 准 化 的 浮动 点 中 的 异常 处 理 C， 最 浮 点 运算 也 不 会 检查 。 


exceptionReferenceError 弱 引 用 代理 ， 由 weakref.proxy() 画 数 中 ， 创 建 用 于 访问 属性 的 指 涉 
后 它 已 被 垃圾 回收 , 时 ， 将 引发 此 异常 。 弱 引用 的 详细 信息 ， 请 参阅 weakref 模 块 。 


新 版 本 2.2 中 的 : 以 前 称 为 weakref。ReferenceError 异 常 。 


exceptionRuntimeError 这 不 会 在 任何 其 他 类 别 中 检测 到 错误 时 引发 。 关 联 的 值 是 一 个 字符 
串 ， 指 示 什 么 精确 地 走 错 了 。 


exceptionStoplteration 提出 的 迭代 器 的 next () 方 法 ， 信 号 说 那里 是 没有 进一步 的 值 。 这 是 例 
外 ， 而 不 是 StandardError， 从 推导 出 来 的 因为 这 被 认为 是 一 种 不 在 其 正常 的 应 用 程序 中 的 错 


误 。 
新 版 本 2.2 中 的 。 


exceptionSyntaxError 当 解 析 器 遇 到 语法 错误 时 引发 。 阅 读 的 最 初 的 脚本 或 标准 输入 (也 是 
以 交互 方式 ) 时 ， 这 可 能 发 生 在 exec 语 句 中 调用 内 置 范 数 eval () 或 input ()， 或 导入 的 语句 
中 。 


此 类 的 实例 有 属性 文件 名 、 空 格 符 、 偏 移 量 和 更 容易 访问 详细 信息 的 文本 。str() 的 异常 实例 返 
回 唯一 的 消息 。 


exceptionIndentationError 与 相关 的 缩 进 不 正确 的 语法 错误 的 基 类 。 这 是 SyntaxError 的 一 个 
子 类 。 


exceptionTabError 当 压 痕 包 含 制 表 符 和 空格 的 使 用 不 一 致 时 引发 。 这 是 IndentationError 的 一 
个 子 类 。 


exceptionSystemError 当 译员 发 现 内 部 错误 ， 但 情况 看 起 来 不 那么 严重 ， 使 它 不 得 不 放弃 所 
有 希望 时 引发 。 关 联 的 值 是 一 个 字符 串 ， 指 示 发 生 错 误 〈 在 底层 的 角度 来 说 )。 


你 应 该 向 作者 或 维护 者 你 Python 解释 器 报告 。 一 定 要 报告 的 Python 解释 器 版 本 
(sys.version ; 它 也 印 在 Python 的 交互 式 会 话 开始 时 ) ， 确 切 的 错误 消息 (异常 的 关联 
fa) ， 如 果 可 能 的 程序 源 代码 ， 触 发 错误 。 


exceptionSystemExit 由 sys.exit() 本 数 引发 此 异常 。 当 它 不 处 理 时 ，Python 解释 器 退出 ; 打 
印 没 有 堆栈 回溯 。 如 果 关 联 的 值 是 一 个 普通 整数 ， 它 指定 系统 退出 状态 (传递 给 C Mexit()H 
数 ) ; 如 果 它 是 None， 退 出 状态 为 需 ; 如 果 它 有 另 一 种 类 型 (如 字符 串 ) ， 该 对 象 的 值 
印 ， 退 出 状态 是 一 个 。 


实例 具有 的 属性 代码 设置 为 (默认 情况 下 没有 ) ” 拟 议 的 退出 状态 或 错误 消息 。 此 外 ， 此 异常 
派生 直接 从 BaseException 和 不 StandardError， 因 为 它 不 是 技术 上 的 错误 。 


对 Sys.exit() 的 调用 被 翻译 成 异常 ， 以 便 可 以 执行 清理 处 理 程序 (最 后 条 款 try 语 句 ) ， 并 且 ， 
以 便 调试 器 可 以 执行 一 个 脚本 不 运行 失控 的 风险 。 如 果 它 是 绝对 有 必要 退出 立即 (例如 ， 在 
子 进程 后 对 os.fork() 的 调用 ) ， 可 以 使 用 os，exit() 范 数 。 


异常 继承 BaseException 而 不 是 StandardError 或 异常 ， 以 便 不 意外 地 被 捕获 的 异常 的 代码 。 
这 人 允许 将 异常 正确 传播 起 来 并 导致 该 解释 器 退出 。 


2.5 版 本 中 的 更 改 : 更 改 为 从 BaseException 继 承 。 


exceptionTypeError 当 操 作 或 函数 应 用 于 不 合适 类 型 的 对 象 时 引发 。 关 联 的 值 是 字符 串 ， 它 
提供 有 关 类 型 不 匹配 的 详细 信息 。 


exceptionUnboundLocalError 当 提 及 到 一 个 本 地 变量 在 函数 或 方法 ， 但 没有 值 已 绑 定 到 该 变 
量 时 引发 。 这 是 NameError 的 一 个 子 类 。 


在 2.0 版 中 的 新 。 


exceptionUnicodeError 有 关 Unicode 编码 或 解码 错误 出 现时 引发 。 它 是 ValueError 的 一 


Ko 


UnicodeError 具 有 描述 编码 或 解码 错误 的 属性 。 例 如 ， err.object[err.start:err.end] 给 出 了 所 编 
解码 器 的 失败 与 特定 的 无 效 输入 。 


encoding 引发 错误 编码 的 名 称 。 

reason 描述 特定 的 编码 解码 器 错误 的 字符 串 。 
object 编 解 码 器 对 象 试 图 进行 编码 或 解码 。 
start 第 一 个 索引 的 对 象 中 的 数据 无 效 。 

end 后 最 后 一 个 无 效 的 数据 对 象 中 的 索引 。 

在 2.0 版 中 的 新 。 


exceptionUnicodeEncodeError 编码 过 程 中 出 现 的 一 个 Unicode 相关 的 错误 时 引发 。 它 
是 UnicodeError 的 一 个 子 类 。 


新 版 本 2.3。 


exceptionUnicodeDecodeError 解码 过 程 中 出 现 的 一 个 Unicode 相关 的 错误 时 引发 。 它 
是 UnicodeError 的 一 个 子 类 。 


新 版 本 2.3。 


exceptionUnicodeTranslateError 在 翻译 过 程 中 出 现 的 一 个 Unicode 相关 的 错误 时 引发 。 它 
是 UnicodeError 的 一 个 子 类 。 


新 版 本 2.3。 


exceptionValueError 当 内 置 操 作 或 功能 接收 具有 正确 的 类 型 ， 但 不 正确 的 值 ， 这 样 一 种 说 
法 ， 这 种 情况 不 描述 的 更 精确 异常 (如 IndexError 时 引发 。 


exceptionVMSError 仅 在 VM 上 可 用 。 当 VM 特定 错误 时 引发 。 


exceptionWindowsError Windows 特定 的 错误 发 生 时 ， 或 者 是 错误 号 码 不 对 应 errno 值 时 引 
发 。 人 从 Windows 平 
台 API 的 返回 值 。Errno 值 季 winerror 值 映射 到 相应 的 errno.h 值 。 这 是 OSError 的 一 个 子 类 。 


ft 2.0 版 中 的 新 。 
2.5 版 本 中 的 更 改 : 以 前 的 版 本 放 和 人 errno 的 GetLastError() 代 码 。 


exceptionZeroDivisionError 当 一 个 司 或 取 模 操作 的 第 二 个 参数 是 需 时 引发 。 关 联 的 值 是 一 个 
字符 串 ， 指 示 的 操作 数 和 操作 的 类 型 。 


以 下 异常 作为 警告 类 别 使 用 ; 详细 信息 请 参阅 warnings 模 块 。 
exceptionWarning 警告 类 的 基 类 。 

exceptionUserWarning 对 于 由 用 户 代码 生成 警告 的 基 类 。 
exceptionDeprecationWarning 有 关 已 弃 用 功能 的 警告 的 基 类 。 
exceptionPendingDeprecationWarning 警告 有 关 将 在 未 来 被 否决 的 功能 的 基 类 。 
exceptionSyntaxWarning 警告 有 关 可 疑 语 法 的 基 类 
exceptionRuntimeWarning 基 类 有 关 可 疑 的 运行 时 行为 的 警告 。 
exceptionFutureWarning 基 类 构造 ， 它 们 会 在 未 来 发 生 语义 变化 有 关 的 警告 。 
exceptionlmportWarning 导入 模块 中 可 能 错误 的 警告 的 基 类 。 

2.5 版 中 新 增 。 

exceptionUnicodeWarning Unicode 相 关 的 警告 的 基 类 。 


2.5 版 中 新 增 。 


BaseException 


+-- SystemExit 


+-- KeyboardInterrupt 


+-- GeneratorExit 


+-- Exception 


+-- StopIteration 


+-- StandardError 
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+-- BufferError 

+-- ArithmeticError 

| +-- FloatingPointError 

| +-- OverflowError 

| +-- ZeroDivisionError 

+-- AssertionError 

+-- AttributeError 

+-- EnvironmentError 

| +-- IOError 

| +-- OSError 

| +-- WindowsError (Windows) 

| +-- VMSError (VMS) 

+-- EOFError 

+-- ImportError 

+-- LookupError 

| +-- IndexError 

| +-- KeyError 

+-- MemoryError 

+-- NameError 

| +-- UnboundLocalError 

+-- ReferenceError 

+-- RuntimeError 

| +-- NotImplementedError 

+-- SyntaxError 

| +-- IndentationError 

| +-- TabError 

+-- SystemError 

+-- TypeError 

+-- ValueError 

+-- UnicodeError 
+-- UnicodeDecodeError 
+-- UnicodeEncodeError 
+-- UnicodeTranslateError 
-- Warning 

+-- DeprecationWarning 

+-- PendingDeprecationWarning 

+-- RuntimeWarning 

+-- SyntaxWarning 

+-- UserWarning 

+-- FutureWarning 

+-- ImportWarning 

+-- UnicodeWarning 

+-- BytesWarning 


7. String Services 


The modules described in this chapter provide a wide range of string manipulation 
operations. 


In addition, Python’s built-in string classes support the sequence type methods described in 
the Sequence Types — str, unicode, list, tuple, bytearray, buffer, xrange section, and also 
the string-specific methods described in the String Methods section. To output formatted 
strings use template strings or the % operator described in the String Formatting Operations 
section. Also, see the re module for string functions based on regular expressions. 


8. Data Types 


The modules described in this chapter provide a variety of specialized data types such as 
dates and times, fixed-type arrays, heap queues, synchronized queues, and sets. 


Python also provides some built-in data types, in particular, dict, list, set (which along with 
frozenset, replaces the deprecated sets module), and tuple. The str class can be used to 
handle binary data and 8-bit text, and the unicode class to handle Unicode text. 


9. Numeric and Mathematical Modules 


The modules described in this chapter provide numeric and math-related functions and data 
types. The numbers module defines an abstract hierarchy of numeric types. The math and 
cmath modules contain various mathematical functions for floating-point and complex 
numbers. For users more interested in decimal accuracy than in speed, the decimal module 
supports exact representations of decimal numbers. 


10. File and Directory Access 


The modules described in this chapter deal with disk files and directories. For example, 
there are modules for reading the properties of files, manipulating paths in a portable way, 
and creating temporary files. The full list of modules in this chapter is: 


11. Data Persistence 


The modules described in this chapter support storing Python data in a persistent form on 
disk. The pickle and marshal modules can turn many Python data types into a stream of 
bytes and then recreate the objects from the bytes. The various DBM-related modules 
support a family of hash-based file formats that store a mapping of strings to other strings. 
The bsddb module also provides such disk-based string-to-string mappings based on 
hashing, and also supports B-Tree and record-based formats. 


13. File Formats 


The modules described in this chapter parse various miscellaneous file formats that aren4k 
#@ markup languages or are related to e-mail. 


14. Cryptographic Services 


The modules described in this chapter implement various algorithms of a cryptographic 
nature. They are available at the discretion of the installation. 


Hardcore cypherpunks will probably find the cryptographic modules written by A.M. Kuchling 
of further interest; the package contains modules for various encryption algorithms, most 
notably AES. These modules are not distributed with Python but available separately. See 
the URL http://www.pycrypto.org for more information. 


15. Generic Operating System Services 


The modules described in this chapter provide interfaces to operating system features that 
are available on (almost) all operating systems, such as files and a clock. The interfaces are 
generally modeled after the Unix or C interfaces, but they are available on most other 


systems as well. 


16. Optional Operating System Services 


17. Interprocess Communication and Networking 


The modules described in this chapter provide mechanisms for different processes to 


communicate. 


Some modules only work for two processes that are on the same machine, e.g. signal and 
subprocess. Other modules support networking protocols that two or more processes can 
used to communicate across machines. 


18. Internet Data Handling 


This chapter describes modules which support handling data formats commonly used on the 
Internet. 


20. Internet Protocols and Support 


The modules described in this chapter implement Internet protocols and support for related 
technology. They are all implemented in Python. Most of these modules require the 
presence of the system-dependent module socket, which is currently supported on most 
popular platforms. 


26. Debugging and Profiling 


These libraries help you with Python development: the debugger enables you to step 
through code, analyze stack frames and set breakpoints etc., and the profilers run code and 
give you a detailed breakdown of execution times, allowing you to identify bottlenecks in 
your programs. 


28. Python Runtime Services 


Python 2 语言 参考 


这 份 参考 手册 讲述 该 语言 的 语法 和 “核心 语义 ”"。 它 虽然 简洁 ， 但 是 力求 准确 和 全 面 。 不 是 语言 
必要 部 分 的 内 建 对 象 类 型 、 内 建 画 数 和 模块 的 语义 在 Python 标 准 库 中 讲述 。 关 于 语言 的 非 正 
式 的 介绍 ， 请 参阅 Python 教程 。 对 于 C 和 C++ 程序 员 ， 还 存在 另外 两 个 手册 : 扩展 向 入 
Python 解释 器 讲述 关于 如 何 编写 Python 扩展 模块 的 高 级 话题 ，PythomC AP/ 参 考 手 册 详 细 地 
讲解 对 C/C++ 程序 员 可 用 的 接口 。 


1. 简介 
这 份 参考 手册 讲述 Python 编程 语言 。 它 并 不 打算 作为 一 个 教程 。 


除了 语法 和 词法 分 析 ， 在 尽 可 能 精确 的 同时 ， 对 所 有 内 容 我 选择 使 用 英语 而 不 是 形式 化 的 说 
明 。 这 应 该 使 得 这 份 文 档 对 一 般 读 者 更 容易 理解 , 但 将 导致 某 些 地 方 意义 不 明确 。 因 此 , 如 果 
你 来 自 火星 并 试图 仅仅 通过 这 份 文档 重新 实现 Python, 你 可 能 不 得 不 猜测 一 些 东 西 , 其 实事 实 
上 你 将 可 能 最 终 实 现 一 种 完全 不 同 的 语言 。 另 一 方面 , 如 果 你 正在 使 用 Python 并 想 知道 该 语 
言 某 一 方面 明确 的 规则 , 你 一 定 能 在 这 里 找到 它们 。 如 果 你 想 要 看 该 语言 更 正式 的 定义 , 或 许 
你 可 以 自愿 献 出 你 的 时 间 来 写 一 份 一 那 还 不 如 用 来 发 明 一 台 克 隆 机 器 :-)。 


以 不 同 的 方法 工作 。 另 一 方面 ，CPython 是 当前 唯一 一 个 广泛 使 用 的 Python 实现 ( & 
其 它 实现 ) ， 它 的 某 些 怪异 的 地 方 有 时 候 是 值得 提 及 的 ， 尤 其 是 强加 了 人 额外 限制 的 实现 。 
此 ， 你 将 会 发 现 散布 在 整个 文档 中 的 简短 的 "实现 说 明 ”。 


每 一 种 Python 实现 都 伴随 着 若干 内 建 和 标准 模块 。 这 些 文档 位 于 Python 标准 库 。 一 些 内 建 的 
模块 以 重要 的 方式 与 语言 的 定义 交互 时 会 有 所 提 及 。 


1.1. 各 种 实现 


尽管 已 有 一 个 目前 最 为 流行 的 Python 实现 , 但 还 是 有 一 些 其 它 的 实现 , 它们 对 不 同 的 用 户 有 着 
特别 的 吸引 力 。 


已 知 的 实现 包括 : 


CPython 这 是 Python 初始 的 以 及 维护 得 最 好 的 实现 ， 使 用 C 编 写 。 新 的 语言 特性 一 般 会 最 先 在 
这 里 出 现 。Jython 用 Java 实现 的 Python。 这 个 实现 可 以 作为 脚本 语言 在 Java 应 用 中 使 用 ， 或 
者 可 以 用 来 利用 Java 类 库 来 创建 应 用 。 它 也 经 常 被 用 来 为 Java 库 创建 测试 。 更 多 的 信息 可 以 
在 Jython 网 站 上 找到 。 用 于 .NET 的 Python 这 个 实现 实际 上 使 用 了 CPython 实 现 , 但 是 是 一 

个 .NET 托 管 的 应 用 程序 ， 并 使 得 .NET 类 库 可 以 使 用 。 它 由 Brian Lloyd 创 建 。 更 多 信息 请 参 
阅 .NET 版 Python 的 主页 。lIronPython.NET 版 的 另外 一 种 Python。 与 Python.NET 不 同 ， 这 是 
一 个 完整 的 Python 实现 ， 它 产生 儿 L) 并 且 直 接 把 Python 代码 编译 成 .NET 程 序 集 。 它 由 Jython 的 
初始 创建 者 Jim Hugunin 创建 。 更 多 信息 请 参阅 IronPython 网 站 。PyPy 完 全 用 Python 写 的 一 
种 Python 实现 。 它 支持 一 些 在 其 它 实现 中 没有 的 高 级 特性 ， 例 如 无 栈 支 持 和 JIT (即时 ) 编译 
器 。 该 项 目的 目标 之 一 是 ， 鼓 励 通过 使 得 改变 解释 器 更 简单 来 试验 语言 本 身 (因为 它 是 用 
Python SA) 。 更 多 信息 可 以 访问 PyPy 项 目的 主页 。 这 里 的 每 一 个 实现 都 会 与 这 份 手册 里 
讲述 的 语言 在 某 些 方面 有 所 不 同 , 或 者 引入 超出 标准 Python 文档 内 容 的 特殊 信息 。 请 参阅 特 
定 实现 的 文档 以 确定 关于 你 正在 使 用 的 特定 实现 ， 你 还 需要 了 解 些 什么 。 


1.2. 语法 符号 


词法 分 析 和 语法 的 描述 使 用 一 种 修改 过 的 BNF 语 法 符号 。 它 使 用 以 下 风格 的 定义 : 


lc letter (lc letter | "_")* 
Walt ante Uo aul 


name 
lc letter : 


B— 7 Ziinameze—Ne letter, AHRBA—FKSThRSNe_letterAl FX ZARA. Tz 
着 ， 一 个 lc_letter 是 'a' 到 'z' 之 间 任 意 一 个 单个 字符 。 (这 个 规则 事实 上 就 是 该 文档 中 词法 和 语 
法 规则 中 的 名 称 的 定义 方式 。) 


每 条 规则 以 一 个 名 字 〈 这 条 规则 定义 的 名 字 ) 和 ::= 开 始 。 竖 线 (|) 用 于 分 隔 可 选 的 项 ; 它 是 该 
语法 符号 中 绑 定 性 最 弱 的 操作 符 。 星 号 () 表 示 前 面 项 目的 需 个 或 多 个 重复 ; 类 似 地 , 加 号 (+) 表 
示 一 个 或 多 个 重复 , 而 方 括 号 (人 ) 表 示 里 面 的 内 容 出 现 堆 次 或 一 次 ( 换 句 话说 , 方 括号 中 的 内 容 
是 可 选 的 ) 。 和 + 操作 符 的 绑 定 性 最 强 ; 圆 括 号 用 于 分 组 。 字 符 串 字面 值 由 引号 引起 来 。 空 格 
只 对 分 隔 标 识 符 有 意义 。 规 则 通常 包含 在 单独 的 一 行 中 ; 具有 许多 可 选项 的 规则 可 能 会 在 第 
一 行 之 后 ， 每 一 行 以 一 个 坚 线 开 始 。 


在 词法 定义 中 (如 上 面 的 例子 ) ， 还 使 用 了 两 个 额外 的 约定 : 三 个 点 号 分 隔 的 两 个 字符 表示 
给 出 的 范围 内 (包括 这 两 个 字符 ) 的 任何 一 个 单个 ASCll 字 符 。 尖 括号 (<...>) 中 的 内 容 表 示 不 
是 定义 的 符号 的 正式 描述 ; 例如 ， 如 果 需 要 这 可 以 用 来 描述 ' 控 制 字符 ' 的 概念 。 

虽然 使 用 的 语法 符号 几乎 完全 一 样 ， 词 法 和 语法 定义 之 间 的 含义 有 一 个 巨大 的 差异 : 词法 定 
义工 作 在 输入 的 单个 字符 上 ， 而 语法 定义 工作 在 由 词法 分 析 生 成 的 标识 符 流 上 。 下 一 章 (“ia 
法 分 析 ”") 中 使 用 的 所 有 BNF 都 是 词法 定义 ; 再 往 后 的 几 章 是 语法 定义 。 


2. 词法 分 析 

Python 程序 由 解析 器 读 取 。 输 入 到 解析 器 中 的 是 由 词法 分 析 器 生成 的 词 符 流 。 本 章 讲 述 词 法 
分 析 器 如 何 把 一 个 文件 拆 分 成 词 符 。 

Python 程序 的 文本 使 用 7 比特 ASCIl 字 符 集 。 

2.3 版 中 新 增 : 可 以 使 用 编码 声明 指出 字符 串 字 面值 和 注释 使 用 一 种 不 同 于 ASCII 的 编码 。 


为 了 和 旧 的 版 本 兼容 ， 如 果 发 现 8 比 特 字符 ，Python 只 会 给 出 警告 。 修 正 这 些 警 告 的 方法 是 声 
明显 式 的 编码 ， 或 者 对 非 字 符 的 二 进 制 数 据 字 节 使 用 转 义 序列 。 


运行 时 的 字符 集 取决 于 与 程序 连接 的 MO 设备 ， 但 通常 都 是 ASCII 的 超 集 。 


未 来 兼容 性 的 注意 事项 : 可 能 会 假设 8 比特 字符 的 字符 集 是 ISO Latin-1 (ASCII 字 符 集 的 超 
集 ， 履 盖 了 大 部 分 使 用 拉丁 字母 的 西方 语言 ) ， 但 是 在 未 来 Unicode 文 本 编辑 器 可 能 变 得 通 
用 。 这 些 编辑 器 通常 使 用 UTF-8 编 码 ， 它 也 是 ASCII 的 超 集 ， 但 是 序数 在 128-255 之 间 的 字符 
的 用 法 非常 不 一 样 。 关 于 这 个 主题 还 没有 一 致 的 意见 ， 假 设 是 Latin-1 或 UTF-8 都 不 明智 ， 即 使 
当前 的 实现 似乎 倾向 于 Latin-1。 源 文件 的 字符 集 和 运行 时 的 字符 集 都 适用 。 


2.1. 行 结构 


一 个 Python 程序 被 分 割 成 若干 逻辑 行 。 
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逻辑 行 的 结束 由 NEWLINE 词 符 表 示 。 语 句 不 能 跨越 逻辑 行 的 边界 除非 语法 允许 
NEWLINE (例如 ， 复 合 语句 的 语句 之 间 ) 。 通 过 遵循 显 式 或 隐 式 的 行 连接 规则 ， 一 个 逻辑 行 
由 一 个 或 多 个 物理 行 构成 。 


2.1.2. 物理 行 


一 个 物理 行 是 一 个 被 行 结束 序列 终止 的 字符 序列 。 在 源 文件 中 ， 任 何 标准 平台 的 行 终止 序列 
都 可 以 使 用 - Unix 方 式 使 用 ASCII 的 LF (换行 ) ，Windows 方 式 使 用 ASCII 序 列 CR LF( 回 车 和 
换行 )， 旧 的 Macintosh 方 式 使 用 ASCII 的 CR ( 回 车 ) 字符 。 


在 谨 入 Python 时 ， 对 于 换行 符 源 代码 字符 串 应 该 使 用 标准 C 的 习惯 传递 给 Python API (代表 
ASCIILF 的 \n 字 符 是 行 终止 符 ) 。 
2.1.3. 注释 


注释 以 非 字符 串 字 面值 中 的 井 号 字符 (#) 开 始 ， 在 物理 行 的 末尾 结束 。 除 非 引起 隐 式 的 行 连接 
规则 ， 否 则 注释 意味 着 逻辑 行 的 结束 。 语 法 会 忽略 注释 ; 它们 不 是 词 符 。 


2.1.4. 编码 声明 


如 果 Python 脚 本 的 第 一 行 或 者 第 二 行 的 注释 匹配 正则 表达 式 coding[=:]\s*([-\w.]+)， 那 么 这 行 
注释 将 作为 编码 声明 义理 ; 该 表达 式 的 第 一 个 分 组 指出 源 文件 编码 的 名 字 。 建 议 的 表达 式 形 


式 是 


# -*- Coding: <encoding-name> -*- 


它 也 能 被 GNU Emacs 识别 ， 或 者 


# vim:fileencoding=<encoding-name> 


它 能 被 Bram Moolenaar 的 VIM 识 别 。 除 此 之 外 ， 如 果 文 件 开 始 几 个 字 节 是 UTF-8 的 字 节 顺序 
标记 ("\Xef\xbb\xbf)， 声 明 的 文件 编码 将 是 UTF-8 (这 个 特性 也 被 微软 的 notepad 和 其 它 编 辑 器 
支持 。) 


如 果 声 明了 编码 ， 那 么 编码 的 名 字 必 须 能 够 被 Python 识别 。 编 码 将 用 于 所 有 的 词法 分 析 ， 特 
别 是 寻找 字符 串 的 结束 ， 和 解释 Unicode 字 面值 的 内 容 。 字 符 串 字面 值 会 被 转换 成 Unicode 来 
做 语法 分 析 ， 然 后 在 解释 开始 之 前 被 转换 回 它 们 初始 的 编码 。 编 码 声 明 必 须 出 现在 它 自己 单 
独 的 一 行 上 。 


2.1.5. 显 式 的 行 连接 


两 个 或 多 个 物理 行 可 以 使 用 反 斜 杠 字符 () 连 接 成 一 个 逻辑 行 ， 方 式 如 下 : 当 一 个 物理 行 以 一 个 
不 是 字符 串 字 面值 或 注释 中 的 反 斜 杠 结束 时 ， 它 会 和 接 下 来 的 一 行 连接 形成 一 个 单独 的 逻辑 
行 ， 反 斜 杠 和 后 面 的 换行 符 会 被 删 掉 。 例 如 : 


if 1900 < year < 2100 and 1 <= month <= 12 \ 
and 1 <= day <= 31 and 0 <= hour < 24 \ 
and 0 <= minute < 60 and 0 <= second < 60: # Looks like a valid date 
return 1 


以 反 斜 杠 结束 的 行 不 能 带 有 注释 。 反 斜 杠 不 能 延续 注释 。 反 斜 杠 不 能 延续 除了 字符 串 字面 值 
以 外 的 词 符 〈 即 不 是 字符 串 字 面值 的 词 符 不 能 使 用 反 斜 杠 分 割 跨 多 个 物理 行 ) 。 一 行 中 位 于 
字符 串 字 面值 以 外 其 它 地 方 的 反 斜 杠 是 非法 的 。 


2.1.6. 隐 式 的 行 连接 


圆 括号 、 方 括号 以 及 花 括号 中 的 表达 式 可 以 分 割 成 多 个 物理 行 而 不 使 用 反 斜 杠 。 例 如 : 


month names = ['Januari', 'Februari', 'Maart', # These are the 


'April', 'Mei', 'Juni', # Dutch names 
Juss 'Augustus', 'September', # for the months 
'Oktober', 'November', 'December'] 4 of the year 


隐 式 的 续 行 可 以 带 注释 。 续 行 的 缩 进 不 重要 。 人 允许 空白 的 续 行 。 隐 式 的 续 行 之 间 没 有 
NEWLINE 词 符 。 隆 式 的 续 行 也 可 以 发 生 在 三 引号 的 字符 串 中 (LER) : 在 这 种 情况 下 它们 
不 可 以 带 注释 。 


2.1.7. 空白 行 


只 包含 空格 符 、 制 表 符 、 换 页 符 和 注释 的 逻辑 行 会 被 忽略 〈 即 不 会 有 NEWLINE 词 符 生成 ) 。 
在 交互 式 输 入 语句 时 ， 空 白 行 的 处 理 可 能 不 同 ， 这 取决 于 read-eval-print 循 环 的 实现 。 在 标准 
实现 中 ， 一 个 完全 的 空白 逻辑 行 ( 即 一 个 不 只 是 包含 空格 或 注释 的 逻辑 行 ) 会 终止 多 行 语 


o 


可 将 


2.1.8. 缩 进 


逻辑 行 开 始 的 前 导 空白 (空格 和 制 表 符 ) 用 来 计算 行 的 缩 进 层级 ， 然 后 用 它 决 定语 句 的 分 
组 。 


首先 ， 制 表 符 被 替换 (MEIA) 成 一 至 八 个 空格 ， 这 样 包括 替换 后 的 字符 的 总 数 是 八 的 整 
数 〈 这 是 为 了 和 Unix 使 用 一 样 的 规则 ) 。 非 空白 字符 之 前 的 空格 总 数 决 定 该 行 的 缩 进 。 缩 进 
不 可 以 使 用 反 斜 杠 分 割 成 多 个 物理 行 ; 直到 第 一 个 反 斜 杠 处 的 空白 决定 了 缩 进 。 


跨 平台 兼容 性 的 注意 事项 : 由 于 非 UNIX 平 台 上 的 文本 编辑 器 的 天 性 ， 在 一 个 源 文件 中 缩 进 混 
合 使 用 空格 和 制 表 符 是 不 明智 的 。 还 应 该 注意 到 不 同 的 平台 可 能 明确 地 限定 最 大 缩 进 的 层 
级 。 


行 的 开始 可 能 会 出 现 换 页 符 ; 它 将 被 上 述 缩 进 的 计算 忽略 。 在 前 导 空 白 其 它 地 方 出 现 的 换 页 
符 的 作用 没有 定义 (例如 ， 它 们 可 能 会 重 置 空格 的 数量 为 需 ) 。 


连续 行 的 缩 进 层级 用 于 生成 INDENT 和 DEDENT 词 符 ， 这 个 过 程 使 用 了 栈 ， 如 下 所 述 。 


在 读 入 文件 第 一 行 之 前 , 一 个 需 被 压 人 堆栈 中 ; 它 将 再 也 不 会 被 弹出 。 压 人 堆栈 中 的 数字 将 永 
远 从 底部 往 顶 部 增长 。 在 每 一 个 逮 辑 行 的 开始 ， 该 行 的 缩 进 层 级 会 与 栈 顶 比较 。 如 果 相 等 ， 
什么 都 不 会 发 生 。 如 果 大 于 栈 顶 ， 将 其 压 人 栈 ， 并 生成 一 个 INDENT 词 符 。 如 果 小 于 栈 顶 ， 它 
必须 是 堆栈 中 已 存在 的 数字 中 的 一 个 ; 栈 中 所 有 大 于 它 的 数 都 将 被 弹出 ， 并 且 每 个 弹出 的 数 
字 都 生成 一 个 DEDENT 词 符 。 到 达 文 件 尾 时 ， 栈 中 剩 下 的 每 一 个 大 于 需 的 数字 也 生成 一 个 
DEDENT 词 符 。 


这 儿 是 一 个 正确 缩 进 的 Python 代码 片段 的 例子 《虽然 有 点 乱 ) 


def perm(1): 
# Compute the list of all permutations of 1 
if len(1) <= 1 
return [1] 

= 全 加 
for i in range(len(1)): 

Su ST [eser E RIP [Ea be 

p = perm(s) 

for x in p: 

r.append(l[i:i*1] + x) 

return r 


下 面 的 例子 展示 了 各 种 缩 进 错误 : 


def perm(1): # error: first line indented 
for i in range(len(1l)): # error: not indented 
s = l[:i] + l[i*1:] 
p = perm(1[:i] + l[i*1:]) # error: unexpected indent 
for x in p: 
r.append(l[i:i*1] + x) 
return r # error: inconsistent dedent 


(事实 上 ; 前 三 个 错误 是 由 解析 器 发 现 的 ; 仅仅 最 后 一 个 错误 是 由 词法 分 析 器 找到 的 -- 
returnr 的 缩 进 层 级 与 堆栈 中 弹出 的 数字 没有 匹配 的 层级 。 


2.1.9. 词 符 之 间 的 空 日 


除非 位 于 逻辑 行 起 始 处 或 者 字符 串 字 面值 当中 ， 空 格 、 制 表 符 和 换 页 符 这 些 空白 字符 可 以 等 
同 地 用 于 分 隔 词 符 。 空 白 仅 当 两 个 词 符 连接 在 一 起 可 以 理解 成 一 个 不 同 的 词 符 时 才 需 要 ( 例 
如 ，ab 是 一 个 词 符 ， 但 a b 是 两 个 词 符 ) 。 


它 的 词 符 


除了 NEWLINE、INDENT 和 DEDENT， 还 存在 以 下 几 类 词 符 : 标识 符 、 关 键 字 、 字 面值 、 操 
作 符 和 分 隔 符 。 空 白字 符 (前 面 讨论 的 断 行 符 除 外 ) 不 是 词 符 ， 而 是 用 于 分 隔 词 符 。 有 歧义 
存在 时 ， 词 符 由 形成 合法 词 符 的 最 长 字符 串 组 成 〈 自 左 向 右 读 取 ) o 


2.3. 标识 符 和 关键 字 


标识 符 (也 称 为 名 字 ) 由 以 下 词法 定义 描述 : 


identifier :: (letter|"_") (letter | digit | "_")* 


letter = lowercase | uppercase 
lowercase := saan sez 
uppercase EAST Zi 
digit EX Ue o 


标识 符 长 度 没 有 限制 。 区 分 大 小 写 。 


2.3.1. KF 


以 下 标识 符 用 作 保 留 字 ， 或 者 叫做 语言 的 关键 字 ， 并 且 不 能 作为 普通 的 标识 符 使 用 。 它 们 必 
须 像 下 面 那样 准确 拼写 : 


and del from not while 
as elif global or with 

assert else if pass yield 
break except import print 

class exec in raise 

continue finally is return 

def for lambda try 


版 本 2.4 中 的 变化 : None 成 为 一 个 常量 并 且 被 编译 器 识别 为 内 建 对 象 None 的 名 字 。 尽 管 不 是 
关键 字 ， 你 也 不 可 以 给 它 赋 值 一 个 不 同 的 对 象 。 


版 本 2.5 中 的 变化 : 使 用 as 和 with 作为 标识 符 会 引发 警告 。 要 使 用 它们 作为 关键 字 ， 需 启用 
with_statement 这 个 未 来 特性 。 


版 本 2.6 中 的 变化 : as 和 with 成 为 真正 的 关键 字 。 


2.3.2 保留 类 别 的 标识 符 
有 几 种 特定 类 别 的 标识 符 (关键 字 除 外 ) 具有 特殊 的 含义 。 这 些 类 别 有 标 志 性 的 模式 就 是 开 
始 和 尾部 的 下 划 线 : 


不 会 被 fommoduleimport 导 入 。 这 个 特殊 的 标识 符 用 于 在 交互 式 解释 器 中 存储 上 一 次 计算 的 
结果 ; 它 存储 在 builtin 模 块 。 不 在 交互 式 模式 时 ，_ 没 有 特别 的 含义 且 是 未 定义 的 。 参 看 
import 语句 一 节 。 

注意 

名 字 经 常用 于 国际 化 ; 关于 这 个 惯例 的 更 多 信息 请 参考 gettext 模 块 的 文档 。 

* 系 统 定 义 的 名 字 。 这 些 名 字 由 解释 器 及 其 实现 (包括 标准 库 ) 定义 。 这 些 系统 定义 的 名 字 在 
特殊 方法 的 名 字 一 节 和 其 它 地 方 讨 论 。 未 来 版 本 的 Python 可 能 会 定义 更 多 的 系统 名 字 。 无 论 
什么 情况 ， 任 何不 遵守 明确 的 文档 使 用 说 明 的 * 使 用 ， 都 可 能 会 带 来 破坏 而 没有 警告 。 XM 


有 变量 。 这 种 类 别 的 名 字 ， 在 类 定义 的 语 境 中 使 用 时 ， 会 被 使 用 一 种 变形 的 形式 重 写 以 避免 
基 类 和 继承 类 的 “私有 ' 震 性 之 间 的 冲突 。 参 考 /标识 符 〈 名 称 ) *](#) 一 节 。 


2.4.1. 字符 串 字 面值 


字符 串 字 面值 由 以 下 词法 定义 描述 : 


stringliteral = [stringprefix](shortstring | longstring) 
stringprefix E pu qup. j ege pp uem Tq UP |) Re te) ERE 
Lose qos Doer qp eye (pori BR 
shortstring := " shortstringitem* "'" | '"' shortstringitem* '"' 
longstring := " longstringitem* "'''" 
| '"""' longstringitem* '"""' 
shortstringitem ::-  shortstringchar | escapeseq 
longstringitem := longstringchar | escapeseq 
shortstringchar ::- «any source character except "N" or newline or the quote» 
longstringchar := «any source character except "\"> 
escapeseq := "N" «any ASCII character»? 


上 面 产生 式 中 没有 表示 出 来 一 个 的 语法 限制 是 ， 在 stringprefix 与 其 余 字符 串 字 面值 之 间 不 克 
许 出 现 空 白字 符 。 字 符 集 由 编码 声明 定义 ; 如 果 源 文件 中 没有 指定 编码 声明 ， 则 为 ASCII ; 参 
考 编码 声明 一 节 。 


用 简单 的 中 文 来 描述 就 是 : 字符 串 字 面值 可 以 包含 在 配对 的 单 引 号 (") 或 双 引 号 (") 中 。 它 们 也 可 
以 包含 在 配对 的 三 个 单 引 号 或 双 引 号 组 中 (这 些 字符 串 一 般 称 为 三 引号 字符 串 ) 。 反 斜 杠 () 
用 于 转 义 具有 特殊 意义 的 字符 ， 例 如 换行 、 反 斜 杠 本 身 或 者 引号 。 字 符 串 字面 值 可 以 加 一 个 
前 级 字母 r' 或 者 'R' ; 这 些 字符 串 称 为 原始 字符 串 并 且 使 用 不 同 的 规则 解释 反 斜 杠 转 义 的 序 
列 。 前 缀 局 或 "U' 使 得 字符 串 成 为 一 个 Unicode 字 符 串 。Unicode 字符 串 使 用 由 Unicode 协会 和 
ISO 10646 定 义 的 Unicode 字符 集 。Unicode 字符 串 中 有 效 的 一 些 额外 转 义 序列 会 在 下 面 描 
述 。 前 级 'b' 或 'B' 在 Python 2 中 被 忽略 ; 在 Python 3 中 ， 它 表示 那个 字面 值 应 该 是 一 个 字 节 型 字 
面值 (例如 ， 用 2to3 自 动 转换 代码 的 时 候 ) 。 前 级 'U' 或 'b' 后 面 可 以 跟随 一 个 前 级 'r'。 


在 三 引号 字符 串 中 ， 没 有 转 义 的 换行 和 引号 是 允许 的 (并 且 会 被 保留 )， 除 非 三 个 未 转 义 的 
引号 终止 了 字符 串 。 (引号 指 用 于 开始 字符 串 的 字符 ， 例 如 ' 或 "。) 

除非 出 现 前 级 r' 或 'R'， 否 则 字符 串 中 的 转 义 序列 依照 类 似 标 准 C 使 用 的 规则 解释 。 可 识别 的 
转 义 序列 有 : 


转 义 序列 BL 说 明 


\newline 忽略 

\ BASAL () 

v 单 引号 (") 

M 双 引 号 (") 

\a ASCII 4^ (BEL) 

\b ASCII 退 格 (BS) 

\f ASCII 换 页 (FF) 

\n ASCII 换 行 (LF) 

\N{name} Unicode 数 据 库 中 名 为 name 的 字符 (Unicode only) 

\r ASCIIIB] & (CR) 

\t ASCII 水 平 制 表 (TAB) 

\UXXXX 16 位 的 十 六 进 制 值 为 XXXx 的 字符 (Unicode only) (1) 

\UXXXXXXXX 32 位 的 十 六 进 制 值 为 XXXx 的 字符 (Unicode only) (2) 

\v ASCII E ti (VT) 

\ooo 八进制 值 为 000 的 字符 (3,5) 

\xhh 十 六 进 制 值 为 hh 的 字符 (4,5) 
说 明 : 


1， 形 成 代理 对 一 部 分 的 代码 单元 可 以 使 用 这 种 转 义 序列 编码 。 

2. 任何 Unicode 字 符 都 可 以 用 这 种 方式 编码 ， 但 如 果 Python 编译 成 使 用 16 比 特 代码 单元 
(默认 行为 ) ， 位 于 基本 多 语言 平面 (BMP) 之 外 的 字符 将 用 代理 对 编码 。 

3. 与 标准 C 一 样 ， 最 多 接受 三 个 八进制 数字 。 

4. 与 标准 C 不 同 ， 要 求 两 个 精确 的 十 六 进 制 数字 。 

5， 在 字符 串 字 面值 中 , 十 六 进 制 和 八进制 转 义 字符 表示 具有 给 定 值 的 字 节 ; 没有 必要 再 用 那 
个 字 节 编码 源 字符 集中 的 字符 。 在 Unicode 字 面值 中 ， 这 些 转 义 字 符 表 示 一 个 具有 给 定 值 
的 Unicode 字 符 。 


与 标准 C 不 同 , 所 有 不 能 识别 的 转 义 序列 都 会 保留 留 在 字符 串 中 维持 不 变 ， 例 如 ， 反 斜 杠 会 保 
留 在 字符 串 串 中 。 (这 个 行为 在 调试 的 时 候 特 别 有 用 : 如 果 敲 错 一 个 转 义 序列 ， 输 出 的 结果 
可 以 很 容易 看 出 是 有 问题 的 。) 同样 要 注意 ， 上 面 表格 中 标记 为 “(Unicode only)” 的 转 义 序 
列 ， 在 非 Unicode 字 符 串 字 面值 中 属于 不 能 识别 的 类 别 。 


当 出 现 前 级 "或 'R' 时 ， 紧 跟 在 反 斜 杠 后 面 的 字符 会 包含 在 字符 串 中 不 变 ， 并 且 所 有 的 反 斜 杠 
都 会 保留 在 字符 串 中 。 例 如 ， 字 符 串 字面 值 r\n" 由 两 个 字符 组 成 : 一 个 反 斜 杠 和 一 个 小 写 
的 'n'。 字 符 串 的 引号 可 以 用 反 斜 杠 转 义 ， 但 是 反 斜 杠 会 保留 在 字符 串 中 ; 例如 ，r\" 是 一 个 由 


两 个 字符 组 成 的 合法 的 字符 串 字 面值 : 一 个 反 斜 杠 和 一 个 双 引 号 sr" 不 是 一 个 合法 的 字符 串 
字面 值 ( 即 使 原始 字符 串 不 能 以 奇数 个 反 斜 杠 结束 ) 。 特 别 地 , 原始 字符 串 不 能 以 一 个 反 斜 线 
结束 〈 因 为 反 斜 杠 会 转 义 随后 的 引用 字符 ) 。 还 要 注意 后 面 紧 跟着 换行 符 的 反 斜 杠 被 解释 为 
字符 串 中 的 两 个 字符 ， 而 不 是 作为 续 行 处 理 。 


如 果 前 级 r' 或 者 'R' 和 前 级 'U' or 'U' 一 起 使 用 ， 那 么 转 义 序列 UXXXX 和 UXXXXXXXX 会 被 处 理 
而 其 它 所 有 反 斜 杠 会 保留 在 字符 串 中 。 例 如 ， 字 符 串 字面 值 ur\u0062\n" 有 三 个 Unicode 字符 
组 成 : 拉丁 小 写字 母 b、' 反 斜 杠 ' 和 ' 拉 丁 小 写字 母 nm。 反 斜 杠 可 以 用 前 面 的 反 斜 杠 转 义 ; 然 
而 ， 两 个 都 会 保留 在 字符 串 中 。 结 果 ， 转 义 序 列 \uXXXX 只 有 在 奇数 个 反 斜 杠 的 时 候 才 能 识 
别 。 


2.4.2. 字符 串 字 面值 的 连接 


多 个 相 邻 的 字符 串 字 面值 (由 空白 分 隔 ) ， 可 能 使 用 不 同 的 引用 习惯 ， 是 允许 的 且 含 义 是 把 
它们 连接 起 来 。 因 此 ，"hello"world' 等 同 于 "helloworld" 。 这 个 特性 能 够 用 于 减少 需要 的 反 斜 
杠 的 数目 以 方便 地 把 很 长 的 字符 串 分 成 几 行 ， 或 者 甚至 给 字符 串 的 某 些 部 分 加 上 注释 ， 例 
如 : 


re.compile("[A-Za-z_]" # letter or underscore 
"[A-Za-z0-9 ]*" # letter, digit or underscore 


) 


注意 ， 这 个 特性 在 语法 层面 上 定义 ， 但 是 在 编译 的 时 候 实 现 。'' 运 算 符 用 于 连接 字符 串 表 达 
式 必 须 在 运行 的 时 候 。 还 需要 注意 ， 字 面值 的 连接 可 以 为 每 个 部 分 使 用 不 同 的 引号 风格 (B 
使 是 混合 原始 字符 串 和 三 引号 字符 串 ) 。 

2.4.3. 数值 字面 值 


有 四 种 类 型 的 数值 字面 值 : 普通 整数 、 长 整数 、 浮 点 数 和 虚数 。 没 有 复数 字面 值 〈 复 数字 面 
值 可 以 由 一 个 实数 和 一 个 虚数 相 加 形成 ) 。 


注意 数值 字面 值 不 包括 符号 ; 像 -1 这 样 的 短语 实际 上 是 由 一 元 运算 符 - 和 字面 值 1 组 成 的 表达 
式 。 


2.4.4. 整数 和 长 整数 字面 值 


整数 和 长 整数 字面 值 可 以 用 以 下 词法 定义 描述 : 


longinteger ::= integer ("1" | "L") 


integer ::= decimalinteger | octinteger | hexinteger | bininteger 
decimalinteger ::- nonzerodigit digit* | "o" 

octinteger ::= "O" ("o" | "O") octdigit+ | "0" octdigit+ 

hexinteger ::= Me" ("x" | "X") hexdigit+ 

bininteger ::= "O" ("b" | "B") bindigit+ 

nonzerodigit uec eg 

octdigit Bess eM. UA 

bindigit um 0 qu 

hexdigit Bee! foliose a tM Mr AI 


大 于 最 大 可 表示 普通 整数 的 普通 整数 字面 值 (GM, 2147483647) 会 被 当 作 长 整数 。[1] 长 整 
数字 面值 大 小 没有 限制 ， 除 了 可 用 内 存 的 容量 。 


一 些 普通 整数 字面 值 (第 一 行 ) 和 长 整数 字面 值 〈 第 二 行 和 第 三 行 ) 的 例子 


7 2147483647 0177 
3L 79228162514264337593543950336L 0377L 0x100000000L 
79228162514264337593543950336 Oxdeadbeef 


2.4.5. 浮 点 效 字 面值 


浮 点 数字 面值 由 以 下 词法 定义 描述 


floatnumber ::=  pointfloat | exponentfloat 
pointfloat ::-  [intpart] fraction | intpart "." 
exponentfloat ::- (intpart | pointfloat) exponent 
intpart ::= digit+ 

fraction r= U." digit+ 

exponent Hos (Se AS (eee qp Me | Eoia 


注意 浮 点 数 的 整数 部 分 和 指数 部 分 可 能 看 上 去 像 八进制 数 ， 但 仍然 用 十 进 制 解释 。 例 如 ， 
077e010 是 合法 的 ， 它 和 77e10 表 示 同 一 个 数 。 浮 点 数字 面值 允许 的 范围 依赖 于 具体 的 实现 。 
一 些 浮 点 数字 面值 的 例子 


3.14 10. 001 1e100 3.14e-10 0e0 


注意 数值 字面 值 不 包括 符号 ; 像 -1 这 祥 的 短语 实际 上 是 由 一 元 运算 符 和 字面 值 1 组 成 的 表达 
式 。 


2.4.6. 虚数 字面 值 


虚数 字面 值 由 以 下 词法 定义 描述 


imagnumber ::= (floatnumber | intpart) ("j" | "J") 


虚数 字面 值 生成 一 个 实 部 为 0.0 的 复数 。 复 数 由 一 对 具有 相同 取 值 范围 的 浮 点 数 表示 。 若 要 创 
建 一 个 实 部 非 需 的 复数 ， 可 以 给 它 相 加 一 个 浮 点 数 ， 例 如 ，(3+4j)。 一 些 虚 数字 面值 的 例子 : 


3.14j 10.j 10j .001j 1e100j 3.14e-10j 


2.5. 操作 符 


以 下 词 符 是 操作 符 : 
+ $ / // % 
<< >> & ^ = 
< > <= >= E II <> 


比较 操作 符 <> 和 != 是 相同 操作 符 的 两 个 可 选 的 拼写 。 推 荐 使 用 != 拼 写 ，<> 已 经 过 时 。 


2.6. 分 隔 符 
以 下 词 符 用 作文 法 中 的 分 隔 符 : 


( ) [ ] { } @ 
+= = = Z3 T= %= 
&- = A= >>= <<= ra 


句号 也 可 以 出 现在 浮 点 数 和 虚数 字面 值 中 。 一 个 连续 三 个 句号 的 序列 在 切片 中 具有 省 略 号 这 
样 特殊 的 含义 。 列 表 的 第 二 部 分 ， 即 参数 化 赋值 运算 符 ， 在 词法 上 是 作为 分 隔 符 处 理 ， 但 也 
执行 运算 。 

以 下 可 打印 ASCII 字 符 作为 其 它 词 符 的 一 部 分 有 着 特殊 的 含义 ， 或 者 对 于 词法 分 析 器 具有 重要 
作用 : 


以 下 可 打印 ASCll 字 符 在 Python 中 没有 使 用 。 它 们 出 现在 字符 串 字 面值 和 注释 之 外 是 无 条 件 的 


一 个 错误 : 


脚注 


| [1] | 在 Python 2.4 之 前 的 版 本 中 ， 在 最 大 的 可 表示 普通 整数 和 最 大 的 无 符号 32 位 数字 
4294967296 〈 在 一 台 使 用 32 位 算术 的 机 器 上 ) 范围 之 间 八 进 制 和 十 六 进 制 字 面值 会 通过 减 去 
4294967296 作 为 负 的 普通 整数 。 | |-----|-----| 


3. 数据 模型 


3.1 对 象 、 值 和 类 型 


对 象 是 Python 对 数据 的 抽象 。Python 程 序 中 所 有 数据 都 由 对 象 或 对 象 之 间 的 关系 表示 。 (A 
理 且 和 与 冯 . 诺 依 曼 的 "存储 程序 计算 机 "模型 一 致 ， 代 码 也 由 对 象 表示 。 ) 


每 个 对 象 都 有 一 个 ID， 一 个 类 型 和 一 个 值 。 对 象 一 旦 建立 ， 它 的 /D 永 远 不 会 改变 ; 你 可 以 认 
为 它 是 该 对 象 在 内 存 中 的 地 址 。'is' 操 作 符 比较 两 个 对 象 的 ID ; id() 画 数 返 回 一 个 表示 对 象 ID 的 
整数 (当前 实现 为 对 象 的 地 址 ) 。 对象 的 类 型 也 是 不 可 变 的 。[1] 对 象 的 类 型 决定 了 对 象 支持 
的 操作 (例如 ,“ 它 有 长 度 吗 ?”) 同时 也 定义 了 该 种 类 型 对 象 的 可 能 的 值 。type() 函 数 返 回 对 象 
的 类 型 〈 它 本 身 也 是 一 个 对 象 ) 。 某 些 对 象 的 值 可 以 改变 。 值 可 以 改变 的 对 象 称 为 可 变 的 ; 
一 旦 建立 ， 值 就 不 可 以 改变 的 对 象 称 为 不 可 变 的 。 (包含 可 变 对 象 引用 的 不 可 变 容器 对 象 在 
可 变 对 象 改 变 时 是 可 以 改变 的 ; 但 容器 仍 被 看 作 是 可 变 的 , 因为 它 所 包含 的 对 象 集 合 是 不 能 变 
的 。 所 以 不 可 变 对 象 与 值 不 可 变 不 是 完全 一 样 的 ， 它 更 加 微妙 。) 一 个 对 象 的 可 变性 由 它 的 
类 型 决定 ; 例如 ， 数 值 、 字 符 串 和 元 组 是 不 可 变 的 ， 而 字典 和 列表 是 可 变 的 。 


对 象 不 可 以 显 式 地 销毁 ; 但 是 当 它 们 不 可 用 时 可 能 被 当 作 垃圾 回收 。 具 体 的 实现 可 以 推迟 垃 
圾 回收 或 完全 忽略 它 一 这 是 垃圾 回收 如 何 实现 的 质量 问题 ， 只 要 依然 能 访问 的 对 象 不 被 回 
收 。 


CPython 实现 细节 : CPython 当前 使 用 引用 计数 机 制 与 〈 可 选 的 ) 循环 连接 垃圾 延迟 检测 机 
制 ， 一 旦 对 象 变 得 不 可 访问 ， 它 将 收集 其 中 大 部 分 ， 但 是 不 保证 收集 包含 循环 引用 的 垃圾 。 
参考 gc 模块 的 文档 可 以 获得 控制 循环 垃圾 回收 的 信息 。 其 它 实现 的 行为 与 之 不 同 并 且 
CPython 的 实现 将 来 也 可 能 会 变化 。 不 要 依赖 对 象 不 可 访问 后 会 立即 终结 (例如 : 永远 关闭 
文件 ) 。 


注意 使 用 具体 实现 的 跟踪 和 调试 工具 可 能 会 保持 正常 情况 下 可 以 回收 的 对 象 一 直 存 活 。 还 要 
注意 使 用 ‘try...except' 语 名 捕获 异常 也 可 能 保持 对 象 一 直 存活 。 


有 些 对 象 包含 “外 部 "资源 的 引用 ， 例 如 打开 的 文件 或 窗口 。 可 以 理解 在 对 象 被 当 作 垃 圾 回收 时 
这 些 资 源 也 被 释放 ， 但 因为 垃圾 回收 不 保证 一 定 发 生 ， 这 样 的 对 象 也 提供 显 式 的 方法 释放 外 

部 资源 ， 通 常 是 close() 方 法 。 强 烈 建议 程序 显 式 关 闭 这 些 对 象 。‘try...finally’ 语 句 提 供 了 一 个 便 
利 的 方式 来 做 这 件 事 。 


有 些 对 象 包含 其 它 对 象 的 引用 ; 它们 叫做 容器 。 容 器 的 例子 有 元 组 ， 列 表 和 字典 。 引 用 是 容 
器 的 值 的 一 部 分 。 大 多 数 情况 下 ， 当 我 们 谈 到 一 个 容器 的 值 时 ， 我 们 是 指 值 ， 而 不 是 所 包含 
的 对 象 的 ID ; 然而 ， 当 我 们 谈论 容器 对 象 的 可 变性 的 时 候 ， 就 只 是 指 被 直接 包含 的 对 象 的 
ID。 因 此 ， 如 果 一 个 不 可 变 对 象 《如 元 组 ) 包含 了 一 个 可 变 对 象 的 引用 ， 那 么 当 这 个 可 变 对 
象 的 值 改变 时 它 的 值 也 发 生 改 变 。 


对 象 的 类 型 几乎 影响 对 象 的 所 有 行为 。 在 某 种 意义 上 甚至 重要 到 影响 对 象 的 识别 : 对 于 不 可 
变 对 象 ， 计 算 新 值 的 运算 符 可 能 实际 上 返回 的 是 一 个 已 存在 的 具有 相同 类 型 和 值 的 对 象 的 引 
用 ， 而 对 于 可 变 对 象 ， 这 是 不 允许 的 。 例 如 ， 在 a=1;b=1 之 后 ，a 和 b 可 能 是 或 者 可 能 不 是 引 
用 同一 个 值 为 1 的 对 象 ， 这 依赖 于 实现 ， 但 c=[};d=[] 之 后 ，c 和 d 可 以 保证 是 引用 两 个 不 同 的 、 
唯一 的 、 新 创建 的 空 列表 。 (注意 c=d=[] 是 把 相同 的 对 象 赋 给 c Ad. ) 


3.2 标准 类 型 的 层次 结构 


以 下 是 一 份 Python 内 建 类 型 的 清单 。 扩 展 模 块 〈 无 论 是 用 C、Java 还 是 用 其 它 语 言 编写 ， 依 
赖 于 具体 实现 ) 可 以 定义 额外 的 类 型 。 未 来 版 本 的 Python 可 能 在 这 个 类 型 层次 机 构 中 增加 其 
它 类 型 (例如 : 有 理 数 、 高 效 存储 的 整数 数组 ， 等 等 ) 。 


下 面 有 些 类 型 的 描述 包含 一 个 列 出 “特殊 属性 ”的 段落 。 这 些 属 性 提供 访问 具体 的 实现 而 不 是 作 
为 一 般 的 目的 使 用 。 它 们 的 定义 在 未 来 可 能 会 改变 。 


None 这 种 类 型 只 有 一 个 值 。。 只 有 一 个 对 象 具有 这 个 值 。 这 个 对 象 通过 内 建 名 字 None 访 
问 。 它 在 许多 情况 下 用 来 表示 没有 值 ， 例 如 ， 没 有 显 式 返回 任何 内 容 的 函数 会 返回 它 。 它 的 
真 值 为 假 。 


Notlmplemented 这 种 类 型 只 有 一 个 值 。 只 有 一 个 对 象 具有 这 个 值 。 这 个 对 象 通过 内 建 名 字 
NotlImplemented 访 问 。 如 果 数 值 方 法 和 复杂 的 比较 方法 没有 为 提供 的 操作 数 实现 某 种 运算 ， 
它们 可 能 返回 这 个 值 。 (解释 器 会 尝试 反射 的 操作 ， 或 者 其 它 退 化 的 操作 ， 依 赖 于 具体 的 运 
算 符 。) 它 的 真 值 为 真 。 

Ellipsis 这 种 类 型 只 有 一 个 值 。 只 有 一 个 对 象 具 有 这 个 值 。 这 个 对 象 通过 内 建 名 字 Ellipsis 访 
问 。 它 用 于 指示 切片 中 出 现 的 ... 语 法 。 它 的 真 值 为 真 。 

numbers.Number 它们 由 数值 字面 量 生成 或 者 由 算术 运算 符 和 内 建 的 算术 函数 作为 结果 返 
回 。 数 值 对 象 是 不 可 变 的 ; 一 旦 创建 ， 它 们 的 值 永 远 不 会 改变 。Python 的 数值 和 数学 上 的 数 
字 关 系 当 然 是 非常 密切 的 ， 但 受到 计算 机 数值 表达 能 力 的 限制 。 


Python 区 分 整数 、 浮 点 数 和 复数 : 
numbers.Integral 它们 表示 数学 上 的 整数 集中 的 元 素 (包括 正 数 和 负数 ) 。 
有 三 种 类 型 的 整数 : 


普通 整数 它们 表示 在 -2147483648 至 2147483647 范围 之 间 的 数 。 (这 个 范围 可 能 会 在 本 地 
机 器 字 较 大 的 机 器 更 大 些 ， 但 不 会 更 小 。) 如 果 某 个 运算 的 结果 超出 这 个 范围 ， 结 果 会 以 长 
整数 正常 返回 (在 某 些 情况 下 ， 会 抛 出 异常 OverflowError) 。 对 于 以 移 位 和 掩 码 为 目的 的 运 
算 ， 整 数 采用 32 位 或 更 多 位 的 二 进 制 补 码 形式 ， 并 且 不 会 对 用 户 隐藏 任何 位 。 (就 是 说 ， 所 
有 4294967296 个 不 同 的 比特 组 合 对 应 于 不 同 的 值 ) 。 


长 整数 长 整数 的 表示 的 数值 范围 没有 限制 ， 只 受 限于 可 用 的 〈 虚 拟 内 存 ) 内 存 。 对 于 以 移 位 
和 掩 码 为 目的 的 运算 ， 长 整数 采用 二 进 制 的 形式 ， 负 数 用 二 进 制 补 码 形式 表示 ， 给 人 的 错觉 
是 一 个 符号 位 向 左 无 限 扩展 的 字符 串 。 


布尔 值 布尔 值 表 示 假 和 真 的 真 值 。 表 示 False 和 True 的 两 个 对 象 是 仅 有 的 布尔 对 象 。 布 尔 类 
型 是 普通 整数 的 子 类 型 ， 布 尔 值 的 行为 在 几乎 所 有 环境 下 分 别 类 似 0 和 1， 例 外 的 情况 是 转换 
成 字符 串 的 时 候 分 别 返回 字符 串 "False" 或 "True"。 


整数 表示 法 的 规则 意 在 让 负数 的 移 位 和 掩 码 运算 具有 最 有 意义 的 解释 ， 并 且 在 普通 整数 和 长 
整数 之 间 转 换 时 具有 最 少 的 意外 。 任 何 运 算 ， 只 要 它 产生 的 结果 在 整数 域 之 中 ， 那 么 在 长 整 
数 域 或 混合 运算 时 将 产生 相同 结果 。 域 之 间 的 转换 对 程序 员 是 透明 的 。 


numbers.Real (float) 这 种 类 型 表示 机 器 级 别 的 双 精 度 浮 点 数 。 你 受 底层 的 机 器 体系 结构 〈 和 
C 或 者 Java 的 实现 ) 控制 接受 的 范围 和 浴 出 处 理 。Python 不 支持 单 精度 浮 点 数 ; 使 用 它 的 原 
因 通 常 是 节省 处 理 器 和 内 存 的 使 用 ， 但 是 相 比 Python 中 对 象 使 用 的 开销 是 微不足道 的 ， 因 此 
没有 必要 支持 两 种 浮 点 数 使 语言 变 的 复杂 。 


numbers.Complex 这 种 类 型 以 一 对 机 器 级 别 的 双 精 度 浮 点 数 表 示 复 数 。 单 精度 浮 点 数 同样 可 
以 用 于 复数 类 型 。 复 数 z 的 实 部 和 虚 部 可 以 通过 只 读 属性 z.real 和 z.imag 获 得 。 


序列 这 种 类 型 表示 有 限 的 顺序 集合 ， 用 非 负数 索引 。 内 建 的 函数 len() 返回 序列 的 元 素 个 数 。 
当 序 列 的 长 度 为 时， 索引 集合 包含 数字 0, 1, ..., n-1。 序 列 a 的 元 素 i 的 选择 使 用 ali] 。 


序列 也 支持 切片 : alij] 选 择 索 引 k 满 足 i<=k<j 的 所 有 元 素 。 作 为 表达 式 使 用 的 时 人 息 ， 切 片 是 一 
个 相同 类 型 的 序列 。 这 隐 含 着 索引 会 从 需 开 始 重新 计数 。 


某 些 序列 还 支持 带 有 第 三 个 " 步 长 "参数 的 "扩展 切片 ”: afij:k] 选择 a 中 所 有 索引 为 x 的 的 元 素 ， 


x-i*nk, n>=0 Hi<=x<j*。 
序列 依据 它们 的 可 变性 分 为 : 


不 可 变 序列 不 可 变 序列 类 型 的 对 象 一 旦 创建 便 不 可 改 交 。 (如 果 这 个 对 象 包含 其 它 对 象 的 引 
用 ， 这 些 引 用 的 对 象 可 以 是 可 变 的 并 且 可 以 改变 ; eG 
改变 。) 


以 下 类 型 是 不 可 变 序 列 : 


字符 串 字符 串 的 元 素 是 字符 。 没 有 单独 的 字符 类 型 ; 字符 用 一 个 元 素 的 字符 串 表 示 。 字 符 表 
示 〈 至 少 ) 8 比特 的 字 节 。 内 建 函 数 chr() 和 ord() 在 字符 和 表示 字 节 数值 的 非 负 整数 之 间 转 
换 。 值 在 0-127 之 间 的 字 节 通常 表示 相应 的 ASCII 值 ， 但 是 对 值 的 解释 由 程序 决定 。 字 符 串 数 
据 类 型 也 用 于 表示 字 节 的 数组 ， 例 如 ， 保 存 从 文件 中 读 取 的 数据 。 


(在 原生 字符 集 不 是 ASCII 的 系统 上 ， 字 符 串 在 内 部 可 以 使 用 EBCDIC Rm, H pgXchr() 
和 ord() 实现 ASCIl 和 EBCDIC 之 间 的 映射 并 且 字 符 串 的 比较 保留 ASCII 顺序 。 或 者 可 能 有 人 
能 够 提出 一 个 更 好 的 规则 ? ) 


Unicode Unicode 对 象 的 元 素 是 Unicode 编码 单元 。 一 个 Unicode 编码 单元 由 一 个 元 素 的 
Unicode 对 象 表示 并 且 可 以 保持 16 位 或 者 32 位 的 值 表示 一 个 Unicode 序数 。 (序数 的 最 大 值 
在 sys.maxunicode 中 给 出 ， 并 依赖 Python 在 编译 的 时 候 是 如 何 配置 的 ) Unicode 对 象 中 可 以 
表示 代理 对 ， 并 被 当 作 两 个 单独 的 元 素 。 内 建 的 函数 unichr() 和 ord() 在 编码 单元 和 表示 定义 在 
Unicode 标准 3.0 中 Unicode 序数 的 非 负 整 数 之 间 转 换 。 和 其 它 编码 之 间 相 互 转 换 可 以 通过 
Unicode 方法 encode() 和 内 建 的 函数 unicode()。 


元 组 元 组 的 元 素 可 以 是 Python 的 任何 对 象 。 两 个 或 多 个 元 素 的 元 组 由 逗号 分 隔 的 一 连 串 表达 
式 形成 。 一 个 元 素 的 元 组 (单元 素 集 ) 可 以 在 一 个 表达 式 的 后 面 附 加 一 个 至 号 形成 (一 个 表 

达 式 自身 不 会 形成 一 个 元 组 ， 因 为 圆 括 号 必须 可 以 用 来 分 组 表达 式 ) 。 一 个 空 的 元 组 可 以 由 

一 个 空 的 圆 括号 对 形成 。 


可 变 序列 可 变 序列 在 生成 之 后 可 以 修改 。 下 标 和 切片 表示 法 可 以 用 于 赋值 和 del (delete) 语 名 
的 对 象 。 


当前 有 两 种 内 建 的 可 变 序列 类 型 : 


列表 列表 的 对 象 可 以 是 Python 任何 对 象 。 列 表 由 在 方 括号 中 放置 一 个 逗号 分 隔 的 一 连 串 表达 
式 形成 。 (注意 生成 长 度 为 0 或 1 的 列表 没有 特殊 的 情形 。 ) 

字 节 数组 一 个 字 节 数组 对 象 是 一 个 可 变 的 数组 。 它 们 由 内 建 的 bytearray() 构造 函数 创建 。 除 
了 可 变性 〈 因 此 不 可 哈 希 ) ， 另 一 方面 字 节 数组 提供 和 不 可 变 字 节 对 象 同样 的 接口 和 功能 。 
扩展 模块 array 提 供 另 外 一 个 可 变 序列 类 型 的 例子 。 


集合 类 型 这 种 类 型 表示 无 序 的 、 有 限 的 集合 ， 集 合 中 的 元 素 是 唯一 的 、 不 可 变 的 对 象 。 正 因 
如 此 ， 它 们 不 可 以 被 任何 下 标 索 引 。 然 而 ， 它 们 可 以 迭代 ， 内 建 画 数 len() 返 回 集合 中 元 素 的 
个 数 。 集 合 常见 的 用 途 有 快速 成 员 关 系 检测 、 从 序列 中 删除 重复 元 素 和 计算 数学 运算 例如 交 
集 、 并 集 、 差 集 和 对 称 差 集 。 


集合 的 元 素 与 字典 的 键 一 样 ， 都 适用 不 可 变 规 则 。 注 意 ， 数 值 类 型 遵循 正常 的 数值 比较 规 
则 : 如 果 两 个 数字 相等 (例如 ，1 和 1.0) ， 其 中 只 有 一 个 可 以 包含 在 集合 中 。 


当前 有 两 种 内 建 的 集合 类 型 : 


€ 这 种 类 型 表示 可 变 的 集合 。 它 们 由 内 建 加 数 set() 构造 函数 创建 并 可 以 在 此 之 后 通过 几 种 
方法 修改 ， 例 如 add()。 


固定 集合 这 种 类 型 表示 不 可 变 集合 。 它 们 由 内 建 沙 数 frozenset() 构 造 器 创建 。 因 为 固定 集合 
不 可 变 且 可 以 哈 希 ， 它 可 以 作为 另外 一 个 集合 的 元 素 或 者 字典 的 键 。 


映射 这 种 类 型 表示 由 任意 索引 集合 作 索 引 的 有 限 对 象 集合 。 下 标 表示 法 a[k] 从 映射 a 中 选择 
Fak 索引 的 元 素 ; 它 可 以 用 在 表达 式 中 并 作为 赋值 或 del 语 句 的 目标 。 内 建 阔 数 len() 返 回 映射 
中 元 素 的 个 数 。 


当前 只 有 一 个 内 建 映射 类 型 : 


字典 这 种 类 型 表示 几乎 可 以 由 任何 值 索 引 的 有 限 对 象 集合 。 不 可 以 作为 键 的 唯一 类 型 是 包含 
列表 或 者 字典 或 者 其 它 可 变 类 型 的 值 ， 这 些 类 型 通过 值 而 不 是 对 象 ID 比 较 ， 原 因 是 字典 的 高 
效 实现 要 求 键 的 哈 希 值 保持 常量 。 注 意 ， 数 值 类 型 遵循 正常 的 数值 比较 规则 : 如 果 两 个 数字 
相等 (例如 ，1 和 1.0) ， 那 么 它们 可 以 互 换 地 使 用 来 索引 同一 个 字典 入 口 。 


典 是 可 变 的 ; 它们 可 以 通过 {...} 表示 法 创建 (参考 Dictionany 的 显示 一 节 ) 。 
扩展 模块 dbm，gdbm 和 bsddb 提 供 另 外 的 映射 类 型 的 例子 。 
可 调用 类 型 这 是 一 种 可 以 使 用 函数 调用 操作 (参考 Cal/s 一 节 ) 的 类 型 : 


用 户 定 义 的 函数 用 户 定 义 的 函数 对 象 由 函数 定义 创建 (参见 函数 定义 一 节 ) 。 它 调用 时 参数 
列表 的 元 素 个 数 应 该 和 函数 的 形式 参数 列表 相同 。 


保存 函数 全 局 变量 的 字典 的 引用 一 函数 定义 所 在 模块 的 
globalsfunc_globals AEG 


特殊 属性 : 
属性 Bx 

docfunc_doc 函数 的 文档 字符 串 ， 如 果 没 有 就 为 None。 E 
namefunc name WANA. E 
module 函数 定义 所 在 的 模块 名 ， 如 果 没 有 就 为 None。 E 
为 具有 默认 值 的 参数 保存 默认 参数 值 的 元 组 ， 如 果 没 有 参 ”可 

defaultsfunc_defaults 数 具 有 默认 值 则 为 None。 z 
codefunc code 表示 编译 后 的 函数 体 的 代码 对 象 。 2 
H 

读 


间 。 


dictfunc_dict 支持 任意 函数 属性 的 命名 空间 。 


XC a 


closurefunc_closure None 或 者 包含 函数 自由 变量 绑 定 的 元 组 。 


大 部 分 标 有 “可 写 " 的 属性 会 检查 所 赋值 的 类 型 。 
版 本 2.4 中 的 变化 : func_name 成 为 如 今 可 写 的 属性 。 


版 本 2.6 中 的 变化 : 引入 双 下 划 线 属性 closure, code, defaults, 和 globals 作 为 对 应 的 func_* 
属性 的 别名 以 向 前 兼容 Python 3。 


豆 数 对 象 同样 支持 获取 和 设置 任意 属性 ， 这 可 以 用 来 附加 元 数据 到 函数 中 。 常 规 属性 可 以 用 
点 号 表示 法 获取 和 设置 。 注 意 当 前 的 实现 只 在 用 户 定义 的 画 数 上 支持 画 数 属性 。 未 来 可 能 
HAERA HRAS IE 


RAE LAME BS RIT EUM ERIN ext RARE; 参见 下 面 内 部 类 型 的 描述 。 


用 户 定义 的 方法 用 户 定义 的 方法 将 类 、 类 的 实例 (或 者 None) 和 任何 可 调用 对 象 (通常 是 一 
SAA PEER) 结合 起 来 。 


特殊 的 只 读 属 性 : imselffg 3x LGR, imun HR ; imclass 对 于 绑 定 的 方法 指 imse/f 
的 类 ， 对 于 未 绑 定 的 方法 指 方法 所 在 的 类 ; doc 指 方法 的 文档 (与 imfunc.doc 相 同 ) ; | name 
指 方法 的 名 字 (5im func. name—3£) ; moaule 指 方法 定义 所 在 模块 的 名 字 ， 如 果 没 有 


则 为 None。 
版 本 2.2 中 的 变化 : im_self 过 去 指 的 是 定义 方法 的 类 。 


版 本 2.6 中 的 变化 : 为 了 Python 3 向 前 的 兼容 性 ，imfunc 也 可 以 使 用 func 访 问 ，imself 可 以 使 
用 ”self 访问 。 


方法 也 支持 访问 (但 不 能 设置 ) 底层 沙 数 对 象 的 任何 画 数 属性 。 


用 户 定义 的 方法 对 象 可 能 在 获取 类 的 一 个 属性 的 时 候 创建 (可 能 通过 类 的 一 个 实例 ) ， 如 果 
那个 属性 是 用 户 定义 的 函数 对 象 或 者 一 个 未 绑 定 的 用 户 方法 对 象 或 者 一 个 类 方法 对 象 。 如 果 
那个 属性 是 用 户 定义 的 方法 对 象 ， 只 有 类 和 存储 在 原始 方法 对 象 中 的 类 或 其 子 类 相同 ， 才 会 
创建 一 个 新 的 方法 对 象 ; 否则 ， 使 用 初始 的 方法 对 象 。 


如 果 用 户 定义 的 方法 是 通过 从 类 中 获取 用 户 定义 的 方法 创建 ， 它 的 im_self 为 None 并 且 方 法 对 
象 称 为 


4. 执行 模型 


4.1. 命名 和 绑 定 


名 称 是 对 象 的 引用 。 名 称 通过 名 称 绑 定 操作 引入 。 程 序 文本 中 名 称 的 每 一 次 出 现 都 会 引用 名 
称 的 绑 定 ， 这 种 绑 定 在 包含 名 称 使 用 的 最 内 层 本 数 块 中 建立 。 


块 是 Python 程序 文本 的 一 个 片段 ， 作 为 一 个 单元 执行 。 下 面 这 些 都 是 块 : Re, HBA Gk 
定义 。 交 互 式 敲 入 的 每 一 个 命令 都 是 块 。 一 个 脚本 文件 〈 作 为 解释 器 标准 输入 的 文件 或 者 在 
解释 器 的 命令 行 中 指定 的 第 一 个 参数 ) 是 一 个 代码 块 。 一 个 脚本 命令 (在 解释 器 的 命令 行 中 
以 -c' 选 项 指定 的 命令 ) 是 一 个 代码 块 。 由 内 建 画 数 execifile() 读 入 的 文件 是 一 个 代码 块 。 传 递 
给 eval() 内 建 画 数 和 exec 语 名 的 字符 串 参 数 是 一 个 代码 块 。 由 内 建 画 数 input() 读 入 并 执行 的 表 
达 式 是 一 个 代码 块 。 


代码 块 在 执行 帧 中 执行 。 帧 包含 一 些 管理 信息 (用 于 调试 ) 并 决定 代码 块 执行 完成 之 后 从 哪 
里 以 及 如 何 继续 执行 。 


定义 域 定义 块 中 名 称 的 可 见 性 。 如 果 局 部 变量 定义 在 一 个 块 中 ， 它 的 定义 域 就 包含 这 个 块 。 
如 果 定 义 出 现在 函数 块 中 ， 定 义 域 将 扩展 到 该 定义 块 中 所 包含 的 任何 块 ， 除 非 被 包含 的 块 为 
该 名 称 引 入 一 个 不 同 的 绑 定 。 类 代码 块 中 定义 的 名 称 的 定义 域 限 制 在 类 代码 块 中 ; 它 不 会 扩 
展 到 方法 的 代码 块 中 - 包括 生成 器 表达 式 ， 因 为 它们 使 用 函数 的 定义 域 实现 。 这 意味 着 下 面 的 
写法 将 会 失败 : 


class A: 
a = 42 
b = list(a + i for i in range(10) ) 


当 名 称 在 代码 块 中 使 用 时 ， 使 用 包含 它 的 最 内 层 定义 域 解析 。 对 于 一 个 代码 块 可 见 的 定义 域 
集合 称 为 该 代码 块 的 环境 。 


如 果 名 称 绑 定 在 代码 块 中 ， 那 么 它 是 该 代码 块 的 局 部 变量 。 如 果 名 称 绑 定 在 模块 的 级 别 ， 那 
么 它 是 一 个 全 局 变量 。 (模块 代码 块 的 变量 既是 局 部 的 又 是 全 局 的 。) 如 果 一 个 变量 在 代码 
块 中 使 用 但 是 没有 在 那里 定义 ， 那 么 它 是 自由 变量 。 


当 完 全 找 不 到 名 称 时 ， 引 发 一 个 NameError 异 常 。 如 果 名 称 引 用 一 个 没有 绑 定 的 局 部 变量 ， 引 


发 一 个 UnboundLocalError 异 常 。UnboundLocalError 是 NameError 的 子 类 。 


下 面 的 句法 结构 将 会 绑 定 名 称 : 函数 的 形式 参数 、import 语 句 、 类 和 阔 数 定义 〈 绑 定 类 或 函数 
的 名 称 于 定义 它们 的 代码 块 中 ) 、 出 现在 赋值 语句 中 的 目标 是 标识 符 、for 循 环 的 头 
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绑 定 导入 的 模块 中 定义 的 所 有 名 称 ， 除 了 以 下 划 线 开头 的 那些 。 这 种 形式 只 可 以 在 模块 级 别 
使 用 。 


出 现在 del 语 句 中 的 目标 也 被 认为 是 这 种 目的 的 绑 定 (尽管 真实 的 语义 是 取消 名 称 的 绑 定 ) o 
解 绑 定 一 个 被 封闭 的 定义 域 引用 的 名 称 是 非法 的 ; 编译 器 将 会 报 一 个 SyntaxError。 


每 个 赋值 和 导 和 人 语句 出 现在 类 或 函数 定义 的 代码 块 中 或 者 出 现在 模块 级 别 (顶级 代码 块 ) 。 


如 果 在 代码 块 的 任意 地 方 出 现 名 称 绑 定 操作 ， 那 么 代码 块 中 该 名 称 的 所 有 使 用 将 被 当做 对 当 
前 代码 块 的 引用 。 当 名 称 在 一 个 代码 块 中 绑 定 之 前 使 用 时 将 导致 错误 。 这 个 规则 是 微妙 的 。 
Python 缺少 声明 并 允许 名 称 绑 定 操作 出 现在 代码 块 内 任何 地 方 。 代 码 块 的 局 部 变量 通过 扫描 
代码 块 的 全 部 文本 的 名 称 绑 定 操作 决定 。 


如 果 代 码 块 中 出 现 global 语 句 ， 那 么 所 有 使 用 该 语句 指明 的 名 称 都 是 引用 顶级 命名 空间 中 的 名 
称 绑 定 。 顶 级 命名 空间 中 名 称 通过 查找 全 局 命名 空间 解析 ， 即 模块 的 命名 空间 包括 代码 块 、 
内 建 的 命名 空间 以 及 builtin 模 块 的 命名 空间 。 首 先 查 找 全 局 命名 空间 。 如 果 那 里 找 不 到 名 
称 ， 就 会 查找 内 建 的 命名 空间 。global 语 句 必须 在 该 名 称 的 所 有 使 用 之 前 。 


与 执行 的 代码 块 相关 联 的 内 建 命名 空间 实际 上 是 通过 查找 它 的 全 局 命名 空间 中 的 builtins 名 称 
找到 的 ; 它 应 该 是 一 个 字典 或 者 一 个 模块 (如 果 是 后 一 种 情况 ， 将 使 用 模块 的 字典 ) 。 默 认 
情况 下 ， 在 main 模 块 中 时 ，builtins 就 是 内 建 的 模块 builtin GER: 没有 's') ; 在 其 它 任何 模 
块 的 时 候 ，builtins 是 builtin 模 块 自 身 的 字典 的 别名 。builtins 可 以 被 设置 成 一 个 用 户 创 建 的 
字典 以 创建 一 个 严格 执行 的 弱 形 式 。 


CPython 实 现 细节 : 使 用 者 不 应 该 触动 builtins ; 严格 地 讲 它 是 实现 细节 。 使 用 者 如 果 想 要 覆 
盖 内 建 命 名 空间 中 的 变量 应 该 导 和 该 builtin GA's’) 模块 并 适当 地 修改 它 的 属性 。 


模块 的 命名 空间 在 模块 第 一 次 导 和 人 时 自动 创建 。 脚 本 的 主 模块 总 是 被 称 为 main。 


global 语 句 具 有 和 同一 个 代码 块 中 名 称 绑 定 操作 相同 的 定义 域 。 如 果 包 含 自 由 变量 的 最 内 层 定 
义 域 包含 一 条 global 语 句 ， 那 么 这 个 自由 变量 被 认为 是 一 个 全 局 变量 。 


类 定义 是 一 条 可 以 使 用 和 定义 名 称 的 可 执行 语句 。 这 些 引 用 遵循 名 称 解析 的 正常 规则 。 类 定 
义 的 命名 空间 变 成 类 的 属性 字典 。 类 定义 域 中 定义 的 名 称 在 方法 中 不 可 见 。 

4.1.1. 与 动态 功能 的 交互 

当 和 与 包含 自由 变量 的 艇 套 定 义 域 联合 使 用 的 时 候 ， 有 几 种 Python 语句 是 非法 的 情况 。 

如 果 交 量 在 一 个 包含 它 的 定义 域 中 被 引用 ， 那 么 删除 它 的 名 称 是 非法 的 。 在 编译 的 时 刻 将 会 


报告 一 个 错误 。 
如 果 在 函数 中 使 用 通配符 形式 的 导入 一 import* 一 并 且 画 数 包 含 或 者 是 一 个 带 有 自由 变量 的 嵌 
套 代码 块 ， 那 么 编译 器 将 会 引发 一 个 SyntaxError。 


如 果 冰 数 中 使 用 exec 且 函数 包含 或 者 是 一 个 带 有 自由 变量 的 府 套 代码 块 ， 那 么 编译 器 将 会 引 
发 一 个 SyntaxError 除 非 执 行为 exec 显 式 指明 局 部 命名 空间 。 ( 换 句 话说，execobj 是 非法 的 ， 
而 execobjinns 是 合法 的 。) 


eval(), execfile()#linput()HMAL Rexecié WRF iF i9] BIN ABI SEE RT RN, BRA 
在 调用 者 的 局 部 和 全 局 命名 空间 中 解析 。 自 由 变量 不 是 在 包含 它们 的 最 内 层 命名 空间 中 解 

析 ， 而 是 在 全 局 命名 空间 中 。[1]exec 语 句 以 及 eval() 和 execfile() 函 数 具有 可 选 参数 以 覆盖 全 局 
和 局 部 命名 空间 。 如 果 只 指明 一 个 命名 空间 ， 则 两 个 命名 空间 都 会 使 用 它 。 


4.2. 异常 


异常 是 一 种 打 断 代码 块 的 正常 控制 流程 以 处 理 错 误 或 者 其 它 意 外 情况 的 方法 。 异 常 在 错误 检 
测 到 的 点 引发 ; 它 可 以 通过 包围 它 的 代码 块 或 者 直接 或 间接 调用 发 生 错 误 的 代码 块 的 代码 块 
义理 。 


Python 解释 器 在 检测 到 运行 时 错误 (例如 除 0) 时 会 引发 一 个 异常 。Python 还 可 以 通过 raise 
语句 显示 地 引发 异常 。 异 常 处 理 器 通过 try ... except 语 句 指定 。 这 种 语句 的 finally 子 句 可 以 用 
来 指定 清除 代码 ， 它 不 处 理 异常 ， 而 是 在 前 面 的 代码 中 无 论 有 没有 出 现 异常 都 会 执行 。 


Python 异常 处 理 使 用 “终止 "模型 : 异常 处 理 器 可 以 查 明 发 生 了 什么 并 在 外 层 继续 执行 ， 但 是 
它 不 可 以 修复 错误 的 根源 并 重 试 失败 的 操作 。 (除非 通过 从 顶层 重新 进入 出 错 的 代码 片 
段 ) o 


当 一 个 异常 没有 被 任何 处 理 ， 那 么 解释 器 会 终止 程序 的 执行 或 者 返回 到 其 交互 式 的 主 循环 。 
在 任何 一 种 情况 下 ， 它 都 会 打印 出 一 个 栈 回 滴 ， 除 了 异常 是 SystemExit 的 时 候 。 


异常 通过 类 的 实例 标识 。except 子 句 的 选择 依赖 于 类 的 实例 : 它 必须 引用 实例 的 类 或 者 其 基 
类 。 实 例 可 以 通过 处 理 器 接收 并 且 可 以 带 有 异常 条 件 的 额外 信息 。 


异常 也 可 以 通过 字符 串 标识 ， 在 这 种 情况 下 except 子 句 通过 对 象 的 ID 选择 。 任 意 一 个 值 可 能 
会 跟随 标识 字符 串 一 起 引发 并 传递 给 处 理 器 。 


异常 的 消息 不 是 Python API 的 一 部 分 。 它 们 的 内 容 可 能 随 着 Python 版 本 不 断 地 改变 而 没有 警 
告 ， 在 多 种 不 同 版 本 的 解释 器 下 运行 的 代码 不 应 该 依赖 这 些 内 容 。 


另 请 参考 如 /语句 小 节 中 的 try 语 句 和 /1raise 语 句 小 节 中 的 raise 语 句 。 
脚注 


| [1] | 出 现 这 种 限制 是 因为 通过 这 些 操作 执行 的 代码 在 模块 编译 的 时 候 不 可 以 访问 。 | |-----|---- 
-| 


5. 表达 式 

一 章 解 释 Python 中 表达 式 的 各 个 组 成 部 分 的 含义 。 
关于 语法 : 在 这 一 章 及 随后 的 章节 中 所 用 到 的 扩展 BNF 语 法 符号 将 用 于 讲述 语法 ， 而 不 是 词 
法 分 析 。 当 一 个 语法 规则 具有 这 样 的 形式 


name  : :二 othername 
且 没 有 给 出 语义 ， 那 么 这 种 形式 的 name 语 义 与 othername 相 同 。 


5.1. 算术 转换 


当下 面 算术 操作 符 的 描述 使 用 短语 “数字 参数 被 转换 为 一 个 共同 的 类 型 "时 ， 这 些 参数 将 使 用 隐 
式 转换 规则 列 出 的 规则 做 隐 式 转换 。 如 果 两 个 参数 都 是 标准 的 数字 类 型 ， 那 么 运用 下 面 的 隐 
式 转换 : 


。 如 果 任 意 一 个 参数 是 复数 ， 将 另外 一 个 转换 成 复数 ; 

。 否则 ， 如 果 任 意 一 个 参数 是 浮 点 数 ， 则 将 另外 一 个 转换 为 浮 点 数 ; 
。 否则 ， 如 果 任 意 一 个 是 长 整数 ， 则 将 另外 一 个 转换 成 长 整数 ; 

。 否则 ， 两 个 参数 必定 都 是 普通 的 整数 且 不 必要 转换 。 


某 些 特定 的 操作 符 适 用 其 它 的 一 些 规则 (例如 ，'%' 操 作 符 左边 的 字符 串 参 数 ) 。 解 释 器 的 扩 
展 可 以 定义 它们 自己 的 转换 规则 。 


5.2. 原子 


原子 是 表达 式 最 基础 的 元 素 。 最 简单 的 原子 是 标识 符 和 字面 值 。 在 引号 、 圆 括号 、 方 括号 或 
者 花 括 号 中 的 封闭 形式 在 语法 上 也 被 分 类 为 原子 。 原 子 的 语法 为 : 


atom identifier | literal | enclosure 


enclosure : parenth_form | list_display 


| generator_expression | dict_display | set_display 
| string conversion | yield atom 


5.2.1. 标识 符 (ZF) 


一 个 以 原子 出 现 的 标识 符 是 一 个 名 称 。 词 法 定义 请 参看 标识 符 和 关键 字 小 节 ， 名 称 和 绑 定 的 
文档 请 参看 名 称 和 绑 定 小 节 。 


当 名 称 绑 定 到 一 个 对 象 上 时 ， 对 该 原子 的 求 值 将 产生 那个 对 象 。 当 名 称 没有 绑 定 时 ， 试 图 对 
它 求 值 将 抛 出 NameError 异 常 。 


私有 变量 名 称 的 改编 : 当 出 现在 类 定义 中 的 标识 符 以 两 个 或 多 个 下 划 线 字符 开始 且 不 是 以 两 
个 或 多 个 下 划 线 结束 ， 它 被 认为 是 那个 类 的 私有 名 称 。 在 为 它们 生成 代码 之 前 ， 私 有 名 称 被 
转换 为 更 长 的 形式 。 该 转换 在 名 称 在 前 面 插入 类 的 名 称 ， 前 导 的 下 滑 线 被 删除 并 插入 一 个 单 
一 的 下 划 线 。 例 如 ， 出 现在 类 Ham 中 的 标识 符 spam 将 被 转换 成 _ Hamspam。 这 种 转换 与 标识 
符 使 用 的 语法 上 下 文 无 关 。 如 果 转 换 后 的 名 称 过 长 (超过 255 个 字符 ) ， 将 可 能 发 生 与 具体 实 
现 有 关 的 截断 。 如 果 类 的 名 称 只 由 下 划 线 组 成 ， 则 不 会 转换 。 


5.2.2. 字面 值 
Python 支持 字符 串 字 面值 和 各 种 数值 字面 值 : 


literal ::= stringliteral | integer | longinteger 
| floatnumber | imagnumber 


在 浮 点 数 和 虚数 复数 ) 情况 下 ， 可 能 只 是 近似 值 。 详 细 信息 参见 字面 值 一 节 。 

所 有 的 字面 值 都 是 不 可 支 数据 关 型 ， 因 此 对 象 的 ID 不 如 它 的 值 重要 。 多 次 计算 具有 相同 值 的 
字面 值 无论 是 程序 文本 中 相同 的 出 现 还 是 不 同 的 出 现 ) 得 到 的 既 可 能 是 同一 个 对 象 也 可 能 
是 具有 相同 值 的 不 同 对 象 。 

5.2.3. 圆 括号 式 

辆 括号 式 是 包含 在 加 括号 中 的 一 个 可 选 表达 式 序列 : 


parenth form ::- "(" [expression list] ")" 


圆 括号 中 的 表达 式 序列 产生 的 就 是 该 表达 式 序列 产生 的 内 容 : 如 果 序 列 包含 至 少 一 个 逗号 ， 
那么 它 产生 一 个 元 组 ; 否则 ， 它 产生 组 成 表达 式 序列 的 那个 单一 表达 式 。 


空 的 圆 括号 对 产生 空 的 元 组 对 象 ; 因为 元 组 是 不 可 变 的 ， 字 面值 的 规则 同样 适用 〈 例 如 空 元 
组 的 两 次 出 现 可 能 产生 相同 或 不 同 的 对 象 ) 。 


注意 元 组 不 是 通过 圆 括号 而 是 逗号 操作 符 形成 。 有 个 例外 是 空 元 组 ， 它 必须 要 有 圆 括号 — A 
许 表 达 式 中 出 现 没有 括号 的 “空白 "将 导致 歧义 并 使 得 常见 的 拼写 错误 无 法 发 现 。 


5.2.4. 列表 表示 式 
列表 表示 式 是 在 方 括号 中 的 可 以 为 空 的 一 系列 表达 式 : 


list_display "[" [expression list | list comprehension] "]" 


list comprehension expression list for 
list for "for" target list "in" old expression list [list iter] 
old expression list : old expression [("," old expression)- [","]] 
old expression or test | old lambda expr 
list for | list if 


"if" old expression [list iter] 


list iter 
list if 


列表 的 表示 式 产 生 一 个 新 的 列表 对 象 。 它 的 内 容 通过 提供 一 个 表达 式 序列 或 者 一 个 列表 推导 
式 指定 。 当 提供 的 是 一 个 逗号 分 隔 的 表达 式 序 列 时 ， 对 它 的 元 素 从 左 向 右 求 值 并 按 此 顺序 放 
入 列表 对 象 中 。 当 提供 的 是 一 个 列表 推导 式 时 ， 它 由 一 个 单一 的 表达 式 后 面 跟着 至 少 一 个 for 
子 句 和 雳 个 或 多 个 for 或 者 他 名 组 成 。 在 这 种 情况 下 ， 新 的 列表 的 元 素 是 由 for 或 者 f 子 句 块 产 
生 ， 这 些 子 句 块 从 左 向 右 钳 套 ， 且 当 到 达 最 内 层 的 代码 块 时 对 表达 式 求 值 以 产生 一 个 列表 元 
素 [1]。 


5.2.5. 集合 和 字典 的 表示 式 


对 于 构造 集合 和 字典 ，Python 提 供 特殊 的 语法 叫做 "表示 式 "， 它 们 有 两 种 方式 : 


。 容器 的 内 容 被 显 式 地 列 出， 或 者 
。 它们 通过 一 系列 循环 和 过 滤 指 合计 算得 到 ， 这 种 方式 叫做 推导 式 。 


推导 式 常 见 的 语法 元 素 为 : 


comprehension ::= expression comp_for 

comp_for := "for" target list "in" or test [comp iter] 
comp iter := comp for | comp if 

comp if := "if" expression nocond [comp iter] 


推导 式 由 一 个 单一 的 表达 式 后 面 跟随 至 少 一 个 for 子 句 加 上 需 个 或 多 个 for 或 者 f 子 句 。 在 这 种 情 
况 下 ， 新 的 列表 的 元 素 是 由 for 或 者 if 子 句 块 产生 ， 这 些 子 句 块 从 左 向 右 嵌 套 ， 且 当 到 达 最 内 层 
的 代码 块 时 对 表达 式 求 值 以 产生 一 个 列表 元 素 。 


注意 ， 推 导 式 在 一 个 单独 的 作用 域 中 执行 ， 所 以 在 目标 序列 中 赋值 的 名 称 不 会 "泄露 "到 外 围 的 
作用 域 中 。 


5.2.6. 生成 器 表达 式 
生成 器 表达 式 是 在 圆 括号 中 的 一 个 简洁 的 生成 器 符号 : 


generator_expression ::= "(" expression comp_for ")" 


生成 器 表达 式 产生 一 个 新 的 生成 器 对 象 。 它 的 语法 与 推导 式 相同 ， 只 是 它 位 于 圆 括号 而 不 是 
方 括号 或 花 括号 中 。 


生成 器 表达 式 中 使 用 的 变量 在 为 生成 器 对 象 调用 next() 方 法 时 才 会 惰性 地 求 值 〈 和 与 普通 的 生成 
器 方式 相同 ) 。 但 是 ， 最 左边 的 for 子 句 会 立即 计算 ， 所 以 它 产 生 的 错误 可 以 在 生成 器 表达 式 
代码 中 的 任何 其 它 可 能 的 错误 之 前 发 现 。 随 后 的 for 子 句 不 可 以 立即 计算 因为 它们 可 能 依赖 于 
前 面 的 for 循 环 。 例 如 : (x*yforxinrange(10)foryinbar(x)). 


圆 括 号 对 于 只 有 一 个 参数 的 调用 可 以 省 略 。 细 节 请 参考 调用 一 节 。 


5.2.7. 字典 表示 式 
字典 表示 式 是 在 花 括 号 中 的 可 以 为 空 的 一 系列 键 / 值 对 。 


dict_display "{" [key_datum_list | dict_comprehension] "}" 
key_datum ("," key_datum)* [","] 


expression ":" expression 


key_datum_list 
key_datum 


dict_comprehension : expression ":" expression comp_for 


字典 表示 式 产生 一 个 新 的 字典 对 象 。 


如 果 给 出 逗号 分 隔 的 键 / 值 对 序列 ， 将 从 左 向 右 对 它们 求 值 以 定义 字典 中 项 : 用 每 个 键 对 象 作 
为 字典 的 键 并 存储 对 应 的 值 。 这 意味 着 你 可 以 在 键 / 值 序列 中 多 次 指定 相同 的 键 ， 但 是 该 键 最 
终 对 应 的 字典 的 值 将 是 最 后 给 出 的 那个 值 。 


字典 推导 式 ， 和 与 列表 和 集合 推导 式 相 比 ， 需 要 两 个 冒号 分 隔 的 表达 式 并 在 后 面 跟随 通常 
的 “for" 和 "if* 子 句 。 当 推导 执行 时 ， 产 生 的 键 和 值 以 它们 生成 的 顺序 插入 到 新 的 字典 中 。 


键 的 类 型 的 限制 在 前 面 的 标准 类 型 的 层次 一 节 中 有 列 出 。 (简要 地 讲 ， 键 的 类 型 应 该 是 可 哈 
希 的 ， 即 排除 所 有 可 变 的 对 象 。) 重复 的 键 之 间 的 冲突 不 会 被 检测 到 ; 一 个 给 定 的 键 的 最 后 
的 值 (表示 式 中 最 右边 的 值 ) 将 获胜 。 

5.2.8. 集合 表示 式 

集合 表示 式 通过 花 括号 表明 ， 与 字典 表示 式 的 区 别 是 缺少 冒号 分 隔 的 键 和 值 : 


set display ::- "{" (expression list | comprehension) "}" 


集合 表示 式 产生 一 个 新 的 可 变 集合 对 象 ， 它 的 内 容 可 以 通过 一 个 表达 式 序列 或 者 一 个 推导 式 
指定 。 当 提供 的 是 一 个 逗号 分 隔 的 表达 式 序 列 时 ， 将 从 左 向 右 计算 它 的 元 素 并 添加 到 集合 对 
象 中 。 当 提供 的 是 一 个 推导 式 时 ， 集 合 根据 推导 式 产 生 的 元 素 构造 。 


不 可 以 用 人 构造 一 个 空 集合 ; 该 字面 值 构 造 一 个 空 的 字典 。 


5.2.9. 字符 串 转 换 式 
字符 串 转换 式 是 包含 在 反 引号 中 的 一 个 表达 式 序列 : 


string conversion ::= "©" expression list "`" 


字符 串 转换 式 计算 包含 的 表达 式 序列 并 根据 结果 对 象 类 型 的 特定 规则 将 结果 对 象 转 换 成 一 个 
字符 串 。 


如 果 对 象 是 一 个 字符 串 、 一 个 数字 、None 或 者 一 个 只 包含 这 些 类 型 的 对 象 ， 那 么 结果 字符 串 
将 是 一 个 合法 的 Python 表达 式 ， 它 可 以 传递 给 内 建 的 eval() 郴 数 以 产生 一 个 具有 相同 值 的 表达 
式 〈 或 者 近似 值 ， 如 果 调 用 的 是 浮 点 数 ) 。 


(特别 地 ， 字 符 串 转 换 式 会 添加 引号 并 将 “古怪 "的 字符 转换 为 转 义 的 序列 ， 这 些 序列 打印 出 来 
是 安全 的 。) 


递归 的 对 象 (例如 ， 直 接 或 间接 包含 自身 引用 的 列表 或 字典 ) 使 用 ... 来 表示 一 个 北 为 的 引用 ， 
其 结果 不 可 以 传递 给 eval() 以 获得 一 个 相等 的 值 (将 引 发 SyntaxError) o 


内 建 画 数 repr() 对 其 参数 所 做 的 转换 与 将 它 放 入 圆 括 号 和 反 引 号 中 完全 相同 。 内 建 画 数 str() 完 
成 类 似 但 更 友好 的 转换 。 


5.2.10. Yield 表达 式 


yield_atom "(" yield_expression ")" 


yield_expression : "yield" [expression_list] 


2.5 版 中 新 增 。 


yield 表 达 式 只 用 于 定义 生成 器 琅 数 ， 且 只 能 用 于 函数 的 定义 体 中 。 在 画 数 定义 中 使 用 yield 表 
达 式 就 可 以 充分 使 得 该 定义 创建 一 个 生成 器 函 数 而 不 是 普通 的 酚 数 。 


当 调 用 生成 器 范 数 时 ， 它 返回 一 个 称 为 生成 器 的 迭代 器 。 然 后 该 生成 器 控制 生成 器 画 数 的 执 
行 。 当 调用 生成 器 的 其 中 一 个 方法 时 ， 执 行 开始 。 此 时 ， 执 行 会 行进 到 第 一 个 yield 表 达 式 ， 
在 那里 执行 被 挂 起 并 返回 expression_list 的 值 给 生成 器 的 调用 者 。 挂 起 的 意思 是 保存 所 有 的 局 
部 状态 ， 包 括 当 前 局 部 变量 的 绑 定 、 指 令 的 指针 和 内 部 的 计算 栈 。 当 通过 调用 生成 器 的 一 个 
方法 来 恢复 执行 时 ， 画 数 可 以 准确 地 继续 执行 就 好 像 yield 表 达 式 只 是 一 个 外 部 的 调用 。 恢 复 
执行 后 yield 表 达 式 的 值 取 决 于 恢复 执行 的 方法 。 


所 有 这 些 使 得 生成 器 范 数 与 协 程 非常 类 似 ; 它们 可 以 yield 多 次 ， 它 们 有 多 个 入 口 点 且 它 们 的 
执行 可 以 挂 起 。 唯 一 的 区 别 是 生成 器 函数 不 可 以 控制 yield 之 后 执行 应 该 从 何 处 继续 ; 控制 始 
终 被 转让 给 生成 器 的 调用 者 。 


5.2.10.1. 生成 器 迭代 器 的 方法 


该 小 节 讲 述 生成 器 迭代 器 的 方法 。 它 们 可 用 于 控制 生成 器 函数 的 执行 。 
注意 当 生 成 器 已 经 在 执行 时 调用 下 面 的 任何 一 个 生成 器 方法 都 将 引发 ValueError 异 常 。 


classgeneratorgenerator.next() 开始 生成 器 函数 的 执行 或 者 在 最 后 一 次 执行 的 yield 表 达 式 处 
恢复 执行 。 当 生成 器 函数 使 用 next() 方 法 恢复 执行 时 ， 当 前 的 yield 表 达 式 始终 None。 然 后 执 
行 继续 行进 到 下 一 个 yield 表 达 式 ， 在 那里 生成 器 被 再 次 挂 起 并 返回 expression_list 的 值 给 
next() 的 调用 者 。 如 果 生 成 器 退出 时 没有 yield 另 外 一 个 值 ， 则 引发 一 个 Stoplteration 异 常 。 


.generator.send(value) 恢复 执行 并 "发 送 "一 个 值 到 生成 器 中 。 该 value 参 数 成 为 当前 yield 表 达 
式 的 结果 。send() 方 法 返回 生成 器 yield 的 下 一 个 值 ， 如 果 生 成 器 退出 时 没有 yield 另 外 一 个 值 

则 引发 Stoplteration。 当 调用 send() 用 于 开始 生成 器 的 执行 时 ， 它 必须 以 None 作 为 参数 进行 调 
用 ， 因 为 没有 接受 该 值 的 yield 表 达 式 。 


generator.throw(type[, value[, traceback]]) 在 生成 器 暂停 的 地 方 引发 一 个 type 类 型 的 异常 ， 并 
返回 生成 器 函数 yield 的 下 一 个 值 。 如 果 生 成 器 在 退出 时 没有 yield 一 个 值 ， 则 引发 Stoplteration 
异常 。 如 果 生 成 器 画 数 没有 捕获 传递 进来 的 异常 或 者 引发 一 个 不 同 的 有 异常， 那么 该 异常 将 传 
播 到 调用 者 。 


generator.close() 在 生成 器 函数 暂停 的 地 方 引 发 一 个 GeneratorExit。 如 果 生 成 器 玉 数 此 后 引 
发 Stoplteration (正常 退出 或 者 由 于 已 经 正在 关闭 ) 或 者 GeneratorExit (没有 捕获 该 异常 ) ， 
close 会 返回 到 调用 者 。 如 果 生 成 器 yield 一 个 值 ， 则 引发 一 个 RuntimeError。 如 果 生 成 器 引发 
其 它 任何 异常 ， 它 会 被 传播 到 调用 者 。 如 果 生 成 器 已 经 由 于 异常 退出 或 正常 退出 ，close() 不 
会 做 任何 事情 。 


这 里 有 个 简单 的 例子 演示 生成 器 和 生成 器 函数 的 行为 : 


>>> def echo(value=None): 
print "Execution starts when 'next()' is called for the first time." 
try: 
while True: 
try: 
value = (yield value) 
except Exception, e: 
value =e 
finally: 
print "Don't forget to clean up when 'close()' is called." 


>>> generator = echo(1) 

>>> print generator.next() 

Execution starts when 'next()' is called for the first time. 
1 

>>> print generator.next() 

None 

>>> print generator.send(2) 

2 

>>> generator.throw(TypeError, "spam") 
TypeError('spam', ) 

>>> generator.close() 

Don't forget to clean up when 'close()' is called. 


另 请 参阅 


PEP 0342 - 通过 增强 的 生成 器 实现 协 程 增强 生成 器 API 和 语法 的 提议 ， 使 得 它们 可 以 作为 简单 
的 协 程 使 用 。 


5.3. 初级 操作 
初级 操作 表示 语言 中 绑 定 性 最 高 的 操作 。 它 们 的 语法 是 : 


primary ::= atom | attributeref | subscription | slicing | call 


5.3.1. 属性 引用 


属性 引用 是 一 个 初级 操作 ， 后 面 跟 随 一 个 句号 和 一 个 名 称 : 


attributeref ::= primary "." identifier 


primary 必 须 是 一 个 支持 属性 引用 类 型 的 对 象 ， 例 如 模块 、 列 表 和 实例 。 接 着 该 对 象 被 要 求生 
成 名 称 为 identifier 的 属性 。 如 果 该 属性 不 可 访问 ， 则 抛 出 AttributeError 异 常 。 否 则 ， 生 成 的 对 
象 的 类 型 和 值 取决 于 该 对 象 。 对 相同 属性 的 多 次 求 值 可 能 产生 不 同 的 对 象 。 


5.3.2. 下 标 
下 标 选择 序列 (字符 串 、 元 组 或 列表 ) 或 者 映射 (字典 ) 对 象 的 一 个 元 素 : 


subscription ::= primary "[" expression_list "]" 


primary 必 须 是 一 个 序列 或 者 映射 类 型 的 对 象 。 


如 果 primary 是 一 个 映射 ， 那 么 expression list 必须 是 一 个 对 象 ， 其 值 为 映射 的 一 个 键 ， 该 下 
标 选择 映射 中 对 应 于 该 键 的 值 。 (expression_ list 是 一 个 元 组 除非 它 只 有 一 个 元 素 。) 


如 果 primary 是 一 个 序列 ， 那 么 expression list 必须 是 一 个 普通 的 整数 。 如 果 该 值 是 负数 ， 则 
加 上 该 序列 的 长 度 〈 所 以 ，x[- 人 1 选择 x 的 最 后 一 个 元 素 。) 结果 值 必须 是 一 个 小 于 序列 元 素 个 
数 的 非 负 整 数 ， 下 标 操作 选择 索引 为 该 值 的 元 素 (从 需 开 始 计数 ) 。 


字符 串 的 元 素 为 字符 。 字 符 不 是 一 个 单独 的 数据 类 型 而 是 只 有 一 个 字符 的 字符 串 。 


5.3.3. 切片 


切片 选择 序列 对 象 〈 例 如， 字符 串 、 元 组 和 列表 ) 中 一 个 范围 内 的 元 素 。 切 片 可 以 用 作 表 达 
式 或 者 作为 赋值 和 del 语 名 的 目标 。 切 片 的 语法 : 


slicing simple slicing | extended slicing 


simple slicing primary "[" short slice "]" 
extended slicing : primary "[" slice list "]" 
slice list slice item ("," slice item)* [","] 
slice item expression | proper slice | ellipsis 


proper slice short slice | long slice 


short slice [lower bound] ":" [upper bound] 
long slice short slice ":" [stride] 

lower bound expression 

upper bound expression 

stride expression 

ellipsis 


这 里 的 形式 语法 有 歧义 : expession list 看 上 去 也 像 slice_ list， 所 以 任何 下 标 也 可 以 解释 为 切 
片 。 为 了 不 引入 更 复杂 的 语法 ， 通 过 定义 在 这 种 情况 下 解释 为 下 标 优先 于 解释 为 切片 来 消除 
歧义 (如 果 slice_list 不 包含 proper_slice 和 ellipse 也 属于 这 种 情况 ) 。 类 似 地 ， 当 slice_list 只 有 
一 个 short_slice 且 没有 末尾 的 喜 号 时 ， 解 释 为 简单 切片 要 优先 于 解释 为 扩展 切片 。 


简单 切片 的 语义 如 下 。primary 必 须 是 一 个 序列 对 象 。 下 界 和 上 界 表 达 式 ， 如 果 存 在 ， 必 须 是 
普通 的 整数 ; 默认 分 别 是 需 和 sys.maxint。 如 果 有 一 个 是 负数 ， 则 将 它 加 上 序列 的 长 度 。 切 片 
选择 所 有 索引 为 Kk 的 元 素 ， 其 中 i<=k<j 且 i 和 /是 指定 的 下 界 和 上 界 。 它 可 能 是 一 个 空 的 序列 。 如 
果 三 者 /位 于 合法 的 索引 范围 之 外 不 会 出 错 ( 这 些 元 素 不 存在 所 以 它们 不 会 被 选择 ) o 


扩展 切片 的 语法 如 下 。primary 必 须 是 一 个 映射 对 象 ， 它 以 从 slice_list 构 造 的 键 做 索引 ， 如 下 
所 示 。 如 果 slice_list 包 含 至 少 一 个 逗号 ， 则 键 是 一 个 包含 slice_item 转 换 的 元 组 ; 否则 ， 
long_slice 作 为 键 。slice_item 是 一 个 表达 式 时 ， 转 换 就 是 那个 表达 式 。slice_item 是 ellipsis 
时 ， 转 换 为 内 建 的 Ellipsis 对 象 。proper_slice 的 转换 是 一 个 切片 对 象 (参阅 标准 类 型 的 层 
次 ) ， 它 的 start、stop 和 step 属 性 分 别 是 表达 式 lower_bound、upper_bound 和 stride 的 值 ， 没 
有 的 表达 式 用 None 代 蔡 。 


5.3.4. 调用 


调用 是 指 用 一 个 可 以 为 空 的 参数 序列 调用 一 个 可 调用 对 象 〈 例 如 ， 一 个 函数 ) 


call ::= primary "(" [argument list [","] 
| expression genexpr for] ")" 
argument list ::=  positional arguments ["," keyword arguments] 
["," "*" expression] ["," keyword arguments] 
["," "**" expression] 
| keyword arguments ["," "*" expression] 
["," "**" expression] 
| "*" expression ["," "*" expression] ["," "**" expression] 
| "**" expression 
positional arguments ::= expression ("," expression)* 
keyword arguments ::= keyword item ("," keyword item)* 
keyword item - identifier "-" expression 


在 位 置 参 数 和 关键 字 参 数 之 后 可 以 存在 一 个 末尾 的 逗号 而 不 影响 语义 。 


primary 必 须 是 一 个 可 调用 的 对 象 (用户 定 义 的 男 数 、 内 建 的 范 数 、 内 建 对 象 的 方法 、 类 对 

象 、 类 实例 的 方法 以 及 某 些 类 实例 自己 也 是 可 调用 的 ; Python 的 扩展 可 以 定义 额外 的 可 调用 
SREB) 。 所 有 的 参数 表达 式 都 将 在 调用 发 生 之 前 求 值 。 关 于 形式 参数 列表 的 语法 请 参考 
KRIEL Fo 


如 果 存 在 关键 字 参 数 ， 它 们 首先 被 转换 为 位 置 参 数 ， 如 下 所 述 。 首 先 ， 创 建 一 个 没有 填充 的 
空位 序列 用 于 形 参 。 如 果 有 NN 个 位 置 参 数 ， 则 它们 被 放置 在 前 N 个 空位 中 。 下 一 步 ， 对 于 每 个 
关键 字 参 数 ， 用 标识 符 决 定 对 应 的 位 置 (如 果 标 识 符 与 第 一 个 形 参 的 名 称 相同 ， 则 使 用 第 一 
个 位 置 ， 以 此 类 推 ) 。 如 果 该 位 置 已 经 被 填充 ， 则 引发 一 个 TypeError 有 异常。 否则， 将 该 参数 
的 值 放 入 该 位 置 并 填充 它 (即使 该 表达 式 是 None， 它 也 会 填充 该 位 置 ) 。 当 处 理 完 所 有 的 参 
数 时 ， 仍 然 没有 填充 的 位 置 将 用 来 自 范 数 定义 的 对 应 默认 值 填 充 。 (AR ERRELE 
计算 一 次 ; 因此 ， 用 于 默认 值 的 可 变 对 象 例如 列表 或 字典 将 被 所 有 没有 指定 对 应 位 置 参 数值 
的 调用 共享 ; 通常 应 该 避免 这 点 。) 如 果 有 没有 填充 的 空位 且 没 有 指定 默认 值 ， 则 引发 一 
个 TypeError 异 常 。 否 则 ， 使 用 这 些 填 满 的 位 置 作为 调用 的 参数 序列 。 

CPython 实 现 细节 : 一 种 实现 可 以 提供 这 样 的 内 建 画 数 ， 它 的 位 置 参 数 没有 名 称 ， 因 此 不 可 


以 通过 关键 字 提供 ， 即 使 它们 由 于 文档 的 需要 而 被 "命名 "。 在 CPython 中 ， 那 些 用 C 实 现 并 使 
用 PyArg_ParseTuple() 解 析 参 数 的 函数 就 是 这 种 情况 。 


如 果 位 置 参数 的 个 数 多 于 形 参 ， 则 引发 一 个 TypeError 异 常 ， 除 非 存在 一 个 使 用 *identifier 语 法 
的 形 参 ; 在 这 种 情况 下 ， 该 形 参 接收 一 个 包含 多 余 位 置 参数 的 元 组 (如 果 没 有 多 余 的 位 置 参 
数 则 为 空 元 组 ) o 


如 果 有 任何 关键 字 参 数 没有 对 应 的 形 参 名 称 ， 则 引发 一 a 除非 存在 一 个 使 用 
**identifier 语 法 的 形 参 ; 在 这 种 情况 下 ， 该 形 参 接收 一 含 多 余 的 关键 字 参 数 的 字典 (使 用 


关键 字 作为 键 ， 参 数值 作为 对 应 的 值 ) ， RT (新 的 ) 空 字 
Bü 


-~o 


如 果 expression 语 法 出 现在 函数 调用 中 ， 那 么 expression 必 须 是 一 个 可 迭代 器 。 来 自 该 可 迭代 
器 的 元 素 被 当 作 额 外 的 位 置 参 数 ; 如 果 位 置 参 数 为 X1, ..., XN 且 expression 求 值 为 一 个 序列 y1， 
.… YM， 那 么 它 等 同 于 用 M+N 个 位 置 参 数 x1, …, XN, y1, ..., yM* 的 调用 。 


这 种 方式 的 后 果 是 虽然 expression 可 以 出 现在 某 些 关 键 字 参数 之 后 ， 但 是 它 将 在 关键 字 参 数 
(以 及 *expressjion 参 数 - 见 下 文 ) 之 前 * 处 理 。 所 以 : 


>>> def f(a, b): 
print a, b 


>>> f(b-1, *(2,)) 
2 1 
>>> f(a=1, *(2,)) 
Traceback (most recent call last): 
File "<stdin>", line 1, in ? 
TypeError: f() got multiple values for keyword argument 'a' 
>>> f(1, *(2,)) 
12 


关键 字 参 数 和 *expression 语 法 都 在 同一 个 调用 中 使 用 很 不 常见 ， 所 以 实践 中 这 种 困惑 不 会 出 
现 。 
如 果 *#*expression 语 法 出 现在 函数 调用 中 ， 那 么 expression 必 须 是 一 个 映射 ， 它 的 内 容 将 被 当 


作 额 外 的 关键 字 参 数 。 某 个 关键 字 在 expression 和 显 式 的 关键 字 参 数 中 都 出 现 的 情况 下 ， 将 引 
发 TypeError 异 常 。 


使 用 identifier 或 者 *identifier 语 法 的 形 参 不 可 以 作为 位 置 参 数 的 横 位 或 者 关键 字 参 数 的 名 称 使 
用 。 使 用 (sublist) 语 法 的 形 参 不 可 以 作为 关键 字 参 数 的 名 称 使 用 ; 最 外 层 的 sublist 对 应 于 单一 
的 一 个 未 命令 参数 模 位 ， 在 所 有 其 它 参 数 的 义理 完成 之 后 参数 的 值 使 用 普通 的 元 组 赋值 规则 
赋值 给 Sublist。 


一 个 调用 永远 返回 某 个 值 ， 即 使 可 能 为 None， 除 非 它 引 发 一 个 异常 。 该 值 如 何 计算 取决 于 可 
调用 对 象 的 类 型 。 


如 果 它 是 一 


一 个 用 户 定义 的 函数 : RRMA, FHSAIIREBAC. KORA 
das a a ; 这 在 画 数 的 定义 一 节 有 讲述 。 当 代码 块 执 行 一 条 return 时 ， 它 表 
示 该 图 数 调 用 的 返回 值 。 


一 个 内 建 的 函数 或 方法 : 结果 取决 于 解释 器 ; 内 建 函 数 和 方法 的 描述 请 参见 内 建 的 范 数 。 
一 个 类 对 象 : 返回 该 类 的 一 个 新 的 实例 。 


一 个 类 实例 的 方法 : 调用 对 应 的 用 户 自 定 义 的 函数 ， 参 数列 表 比 调用 的 参数 列表 多 一 个 元 
素 : 实例 成 为 第 一 个 参数 。 


一 个 类 实例 : 该 类 必须 定义 一 个 call() 方 法 ; 效果 和 调用 该 方法 一 样 。 
5.4. 乘 方 操作 符 


乘 方 操作 符 的 绑 定 性 比 它 左 侧 的 一 元 操作 符 高 ; 比 它 右 侧 的 一 元 操作 符 绑 定性 低 。 其 语法 


E3 . 
AE: 


power ::= primary ["**" u expr] 


因此 ， 在 一 个 没有 括号 的 乘 方 和 一 元 操作 符 序列 中 ， 操 作 符 从 右 向 左 计算 (这 不 会 约束 操作 
数 的 计算 顺序 ) : -1**2 的 结果 是 -1。 


乘 方 操作 符 的 语义 与 用 两 个 参数 调用 内 建 的 pow() 函 数 相同 : 它 产生 左 例 
千 。 其 数值 参数 首先 被 转换 成 相同 的 类 型 。 结 果 的 类 型 是 强制 转换 后 的 参数 类 


操作 符 的 类 型 不 一 样 时 ， 运 用 二 元 算术 操作 符 的 强制 转换 规则 。 对 于 整数 和 长 整数 ， 结 果 的 
类 型 与 (强制 转换 后 的 ) 操作 数 类 型 相同 ， 除 非 第 二 个 参数 为 负数 ; 在 这 种 情况 下 ， 所 有 的 
参数 被 转换 成 浮 点 数 并 返回 浮 点 数 结果 。 例 如 ，102 返 回 100， 但 是 10-2 返 回 0.01。 (最 后 的 
这 个 特性 在 Python2.2 中 添加 。 在 Python2.1 和 之 前 的 版 本 中 ， 如 果 两 个 参数 都 是 整数 且 第 二 
个 参数 为 负 ， 则 会 引发 一 个 异常 ) 。 


0.0 的 负数 乘 方 特 导致 ZeroDivisionError。 负 数 的 小 数 次 紧 将 导致 ValueError。 
5.5. 一 元 算术 和 位 操作 
所 有 的 一 元 算术 和 位 操作 具有 相同 的 优先 级 : 


u_expr ::= power "-" gy expr | "+" u_expr | "~" u expr 


一 元 -〈 负 ) 操作 符 产 生 其 数值 参数 的 负 值 。 
一 元 + GE) 操作 符 产 生 其 数值 参数 保持 不 变 。 


一 元 ~ (I) 操作 符 产 生 其 普通 整数 和 长 整数 参数 按 位 取 反 的 值 。x 按 位 取 反 定义 为 -(X+1)。 它 
只 适用 于 整数 数值 。 


在 这 三 种 情形 中 ， 如 果 参 数 的 关 型 不 合适 ， 都 将 引发 TypeError 异 常 。 


5.6. 二 元 算术 操作 


二 元 算术 操作 具有 传统 的 优先 级 。 注 意 这 里 的 某 些 操作 同样 适用 于 一 些 非 数值 类 型 。 除 了 乘 
方 操作 符 ， 有 两 个 优先 级 ， 一 个 针对 乘法 操作 符 ， 一 个 针对 加 法 操作 符 : 


m expr ::- u expr | mexpr "*" u expr | m expr "//" u expr | m expr "/" u expr 
| m expr "9?" u expr 
a expr ::- mexpr | a expr "+" m expr | a expr "-" m expr 


* (乘法 ) We do ee 其 参数 必须 都 是 数值 ， 或 者 一 个 是 整数 (普通 整数 或 长 
整数 ) 另外 一 个 是 序列 。 在 前 一 种 情况 下 ， 数 值 会 被 转换 成 一 P HS Roig, 
EU 将 进行 序列 的 重复 操作 ; 负 的 重复 值 将 产生 一 个 空 的 序列 。 


/除法 ) 和 / (SEER) 操作 符 产 生 它们 参数 的 商 。 其 数值 参数 首先 被 转换 成 相同 的 类 型 。 普 通 
整数 或 者 长 整数 除法 产生 一 个 相同 类 型 的 整数 ; 其 结果 是 在 算术 除法 的 结果 上 调用 “ 取 整 " 范 
数 。 除 以 老将 引发 ZeroDivisionError 异 常 。 


% 〈 取 模 ) 操作 符 产 生 第 一 个 参数 除 以 第 二 个 参数 后 的 余数 。 其 数值 参数 将 首先 被 转换 成 相同 
的 类 型 。 右 边 的 参数 为 需 将 引发 ZeroDivisionError 异 常 。 参 数 可 以 是 浮 点 数 ， 例 如 ， 
3.14%0.7 等 于 0.34 (因为 3.14 等 于 4*0.7+0.34。) 取 模 操作 符 永远 产生 与 第 二 个 操作 符 符号 
相同 的 结果 (或 者 为 需 ) ; 结果 的 绝对 值 将 严格 小 于 第 二 操作 数 的 绝对 值 [2]。 


整数 的 除法 和 取 模 操作 由 下 面 的 等 式 相 关联 : x==(x/y)*y+(X%y)。 整 数 除法 和 取 模 同样 由 内 建 
Ez divmod() AB XX : divmod(x,y)==(X/y,x%y)。 这 些 等 式 对 于 浮 点 数 不 成 立 ; 类 似 的 等 式 在 
x/y 蔡 换 为 floor(x/y) 或 者 floor(x/y)-1 时 近似 成 立 [3]。 


除了 执行 整数 的 取 模 操作 ，% 操 作 符 还 被 字符 串 和 unicode 对 象 重 载 用 于 执行 字符 串 的 格式 化 
(也 叫做 插值 ) 。 字 符 串 格式 化 的 语法 在 Python 库 参 考 的 字符 串 格 式 化 一 节 讲 述 。 


2.3 版 后 废弃 的 内 容 : 整除 操作 符 、 取 模 操 作 符 和 divmod() 函 数 不 再 为 复数 定义 。 作 为 蔡 代 ， 
如 果 合 适 ， 使 用 将 abs() 函 数 将 其 转换 为 浮 点 数 。 


+ (加 法 ) 操作 符 产 生 其 参数 的 和 。 其 参数 必须 都 是 数值 或 者 都 是 相同 类 型 的 序列 。 在 前 一 种 
情况 下 ， 数 值 被 转换 成 相同 的 类 型 然后 一 起 相 加 。 在 后 一 种 情况 下 ， 序 列 被 连接 在 一 起 。 


-( 减 法) 操作 符 产生 其 参数 差 。 其 参数 首先 被 转换 成 相同 的 类 型 。 


5.7. 移 位 操作 
移 位 操作 的 优先 级 低 于 算术 操作 : 


shift_expr ::= a_expr | shift_expr ( "<<" "22" ) a expr 


这 些 操作 符 接收 普通 整数 或 者 长 整数 作为 参数 。 参 数 会 被 转换 成 一 种 共同 的 关 型 。 它 们 将 第 
一 个 参数 向 左 或 向 右 移动 第 二 个 参数 指出 的 位 数 。 


右 移 n 位 定义 为 除 以 pow(2,n)。 左 移 n 位 定义 为 乘 以 pow(2,n)。 负 的 移 位 数目 会 引发 ValueError 


异常 。 

注 

在 当前 的 实现 中 ， 要 求 右 操作 数 至 多 为 sys.maxsize。 如 果 右 操作 数 大 于 sys.maxsize， 闻 引发 
OverflowError 异 常 。 

5.8. 二 元 位 操作 

下 面 三 种 位 操作 具有 各 自 不 同 的 优先 级 : 


and expr ::= shift expr | and expr "&" shift expr 
xor expr ::- and expr | xor expr "^" and expr 
or expr - xor expr | or expr "|" xor expr 


& 操 作 符 产生 按 位 与 ， 它 的 参数 必须 是 普通 整数 或 长 整数 。 参 数 会 被 转换 成 一 种 共同 的 类 型 。 


人 ^ 操 作 符 产生 按 位 异 或 ， 它 的 参数 必须 是 普通 整数 或 长 整数 。 参 数 会 被 转换 成 一 种 共同 的 类 
型 。 


| 操作 符 产 生 按 位 或 ， 它 的 参数 必须 是 普通 整数 或 长 整数 。 参 数 会 被 转换 成 一 种 共同 的 类 型 。 


5.9. 比较 操作 


与 C 不 同 ，Python 中 所 有 的 比较 操作 具有 相同 的 优先 级 ， 并 低 于 任何 算术 、 移 位 和 位 操作 。 与 
C 不 同 的 还 有 ， 类 似 a<b<c 这 样 的 表达 式 就 是 数学 中 传统 的 含义 。 


comparison or_expr ( comp_operator or_expr )* 


Wen | wu | "==" | Wau | Wenn | "<>" " I=" 
| "ig" ["not"] | ["not"] "in 


comp_operator : 


比较 操作 产生 两 个 值 : True 或 者 False。 


比较 操作 可 以 任意 连接 ， 例 如 x<y<=z 等 同 于 x<yandy<=z， 但 是 y 只 计算 一 次 (在 两 种 情况 中 
当 发 现 x<y 为 假 时 都 不 会 再 计算 z) 。 


形式 上 ， 如 果 a, b, c, ..., y, Z 是 表达 式 且 op1, op2, ..., opN 是 操作 数 ， L| .yopNz 
等 同 于 aop1bandbop2cand...yopNz， 不 同 点 是 每 个 表达 式 值 至 多 计算 一 


注意 aop1bop2c 并 不 意味 着 a 和 c 之 间 会 有 比较 ， 所 以 xz 是 完全 合法 的 〈 尽 管 不 漂亮 ) o 


<> 和 != 两 种 形式 时 等 同 的 ; 为 了 和 与 C 保 持 一 致 ， 倾 向 于 使 用 != ; 下 面 提 到 != 的 地 方 同样 接受 <> 
。 拼 写 <> 被 认为 是 废弃 的 。 


操作 符 <、>、==、>=、<= 和 != 比较 两 个 对 象 的 值 。 对 象 不 需要 具有 相同 的 类 型 。 如 果 两 个 都 
是 数字 ， 它 们 将 被 转 会 成 一 个 共同 的 类 型 。 否 则 ， 不 同类 型 的 对 象 将 永远 是 不 相等 的 ， 虽 然 
顺序 是 固定 的 但 是 是 随机 的 。 你 可 以 通过 定义 cmp 方 法 或 者 像 gt 这 样 更 丰富 的 比较 方法 来 控 
制 非 内 建 类 型 对 象 的 比较 行为 ， 在 Special method names 一 节 有 详细 的 描述 。 


(这 种 不 常见 的 比较 定义 用 于 简化 像 排序 这 种 操作 的 定义 以 及 in 和 notin 操 作 符 。 未 来 ， 不 同 
类 型 对 象 的 比较 规则 可 能 会 改变 。) 


相同 类 型 对 象 的 比较 取决 于 它们 的 类 型 : 
。 数字 按照 算术 意义 比较 。 


e 字符 串 使 用 字符 对 应 的 数值 (AB WMord( 2) 按 字典 序 比 较 。 Unicode 和 人 和 八 比特 
字符 完全 适用 这 种 行为 。[4] 


。 元 组 和 列表 通过 比较 对 应 的 项 按 字典 序 比较 。 这 意味 着 若 要 比较 结果 相等 ， 每 一 个 元 素 
比较 的 结果 必须 相等 且 两 个 序列 的 类 型 必须 相同 并 且 具 有 相同 的 长 度 。 


如 果 不 相等 ， 序 列 按照 它们 第 一 个 不 同 的 元 素 排序 。 例 如 ，cmp([1,2,x],[1,2,y]) 的 返回 值 与 
cmp(x,y) 相 同 。 如 果 对 应 的 元 素 不 存在 ， 则 长 度 较 短 的 序列 排 在 第 一 个 〈 例 如 [1,2] 
<[1,2,3]) 。 


e 映射 (FA) 当 且 仅 当 它们 排 好 序 的 ( 键 ， 值 ) 列表 相等 时 才 相 等 。[5] 虽 然 当 不 相等 时 
的 结果 是 固定 的 ， 但 是 具体 是 怎样 的 结果 是 没有 定义 的 。[6] 


。 其 它 大 部 分 内 建 类 型 的 对 象 是 不 相等 的 除非 它们 是 相同 的 对 象 ; 一 个 对 象 是 小 于 还 是 大 
于 另外 一 个 对 象 的 抉择 虽然 是 随机 的 但 是 在 程序 的 一 次 执行 中 是 一 致 的 。 


操作 符 in 和 notin 用 于 测试 成 员 资 格 。 如 果 x 是 s 的 一 个 成 员 那 么 xins 为 真 ， 否 则 为 假 。xnotins 
返回 xins 的 否定 式 。 成 员 资格 测试 传统 用 于 序列 上 ; 如 果 序 列 包 含 一 个 元 素 与 某 对 象 相等 则 该 
对 象 是 这 个 序列 的 成 员 。 然 而 ， 其 它 许多 类 型 的 对 象 不 用 称 为 序列 而 支持 成 员 资 格 测试 也 是 
合理 的 。 特 别 地 ， 字 典 (针对 键 ) 和 集合 就 支持 成 员 关 系 测试 。 


对 于 列表 和 元 组 类 型 ，xiny 为 真 当 且 仅 当 存在 一 个 索引 / 使 得 x==y[i 为 真 。 

对 于 Unicode 和 字符 串 类 型 ，xiny 为 真 当 且 信 当 x 是 y 的 一 个 子 串 。 

版 本 2.3 中 的 改变 : 之 前 ，x 要 求 是 一 个 长 度 为 1 的 字符 串 。 

对 于 定义 了 contains() 方 法 的 用 户 自 定义 类 ，xiny 为 真 当 且 仅 当 y.contains(x) 为 真 。 


对 于 没有 定义 contains() 但 定义 iter() 的 用 户 自 定义 类 ，xiny 为 真如 果 某 个 值 z 在 迭代 y 时 满足 
x==Z。 如 果 和 迭代 过 程 中 抛 出 异 常 ， 就 好 像 是 in 抛 出 那个 异常 一 样 。 


最 后 ， 尝 试 旧式 的 迭代 协议 : 如 果 一 个 类 定义 了 getitem()，xiny 为 真 当 且 仅 当 有 一 个 非 负 的 
整数 索引 /使 得 x==y[i], 且 更 小 的 索引 不 会 引发 IndexError 异 常 。 (如 果 引 发 了 其 它 异 常 ， 则 像 
是 in 引发 了 该 异常 ) 。 

notin 操 作 符 定义 为 取 和 与 in 相反 的 真 值 。 

is 和 isnot 操 作 测 试 对 象 的 ID : xisy 当 且 仅 当 x 和 y 是 相同 的 对 象 时 为 真 。xisnoty 产 生 相反 的 真 
值 。[7] 


5.10. 布尔 操作 


or_test := and test | or test "or" and test 
and test ::- not test | and test "and" not test 
not test ::- comparison | "not" not test 


在 布尔 操作 的 上 下 文中 ， 同 时 在 控制 流 语句 使 用 表达 式 的 时 候 ， 以 下 的 值 被 解释 为 假 : 
False、None、 所 有 类 型 中 的 数值 才 、 空 的 字符 串 和 容器 (包括 字符 串 、 元 组 、 字 典 和 固定 集 
A) 。 其 它 所 有 的 值 都 解释 为 真 。 (请 参见 nonzero() 特殊 方法 以 获得 改变 这 种 行为 的 方 
式 。) 


如 果 操 作 符 not 的 参数 为 假 则 其 产生 True， 否 则 产生 False。 
表达 式 xandy 首 先 计算 x ; 如 果 x 为 假 ， 则 返回 它 的 值 ; 否则 ， 再 计算 y 并 返回 结果 的 值 。 
表达 式 xory 首 先 计 算 x ; 如 果 x 为 真 ， 则 返回 它 的 值 ; 否则 ， 再 计算 y 并 返回 结果 值 。 


(注意 and 和 or 的 返回 值 都 不 局 限于 False 和 True， 而 是 返回 最 后 计算 的 参数 结果 。 这 在 有 些 
时 候 是 有 用 的 ， 例 如 ， 如 果 s 是 一 个 字符 串 ， 当 它 是 空 的 时 候 应 该 被 一 个 默认 值 蔡 换 ， 那 么 表 
达 式 sorfoo' 就 可 以 产生 想 要 的 值 。 因 为 not 无 论 如 何必 须 生 成 一 个 值 ， 它 不 会 设法 返回 和 其 参 
数 类 型 相同 的 值 ， 所 以 notfoo' 生 成 False, 而 非 "。 ) 


5.11. 条 件 表达 式 
在 版 本 2.5 中 新 引入 。 


conditional expression : or_test ["if" or_test "else" expression] 


expression conditional_expression | lambda_expr 


条 件 表达 式 《有 时 叫做 三 元 操作 符 ”") 在 所 有 的 Python 操作 符 中 具有 最 低 的 优先 级 。 


表达 式 xifCelsey 首 先 计 算 条 件 C (而 非 not**x) ; 如 果 C 为 真 ， 则 计算 x 并 返回 它 的 值 ; 否 
则 ， 计 算 y 并 返回 它 的 值 。 


关于 条 件 表达 式 的 更 多 细节 ， 请 参见 PEP 308。 


5.12. Lambda 表达 式 


lambda expr "lambda" [parameter list]: expression 


old lambda expr : "lambda" [parameter list]: old expression 


Lambda 表 达 式 (有 时 叫做 lambda 形 式 ) 具有 和 表达 式 相同 的 地 位 。 它 们 是 创建 匿名 函数 的 一 
种 快捷 方式 ; 表达 式 lambdaarguments:expression 生 成 一 个 画 数 对 象 。 此 命名 对 象 的 行为 类 
似 下 面 定义 的 函数 对 象 


def name(arguments): 
return expression 


关于 参数 列表 的 语法 ， 请 参见 函数 定义 一 节 。 注 意 lambda 表 达 式 创建 的 事 数 不 可 以 包含 语 
句 。 


5.13. 表达 式 序 列 


expression_list ::= expression ( "," expression )* [","] 
至 少 包 含 一 个 逗号 的 表达 式 序列 产生 一 个 元 组 。 元 组 的 长 度 是 列表 中 表达 式 的 个 数 。 表 达 式 
按 从 左 到 右 的 顺序 计算 。 


尾部 的 逗号 仅仅 在 创建 单元 素 元 组 〈 又 叫 独 元 ) 时 需要 ; 在 其 它 所 有 情况 下 ， 它 都 是 可 选 
的 。 


6. 简单 语句 


简单 语句 包含 在 单一 的 一 个 逻辑 行 中 。 几 个 简单 语句 可 以 用 分 号 分 隔 出 现在 单一 的 一 行 中 。 
简单 语句 的 语法 是 : 


simple_stmt ::= expression_stmt 
assert_stmt 
assignment_stmt 
augmented_assignment_stmt 
pass_stmt 
del_stmt 
print_stmt 


yield_stmt 
raise_stmt 
break_stmt 
continue_stmt 
import_stmt 
global_stmt 


| 

| 

| 

| 

| 

| 

| return_stmt 
| 

| 

| 

| 

| 

| 

| exec_stmt 


6.1. 表达 陈 语句 


表达 式 语句 用 于 (主要 用 于 交互 式 地 ) 计算 和 写 入 一 个 值 ， 或 者 (通常) 调用 一 个 过 程 6k 
回 结 果 没 有 意义 的 函数 ; 在 Python 中 ， 过 程 返回 None 值 ) 。 其 它 表达 式 语 句 的 使 用 也 是 允许 
的 ， 但 是 很 少 有 意义 。 表 达 式 语句 的 语法 是 : 


expression stmt ::= expression list 


表达 式 语句 计算 表达 式 列表 的 值 (也 可 能 是 一 个 单一 的 表达 式 ) 。 


在 交互 模式 下 ， 如 果 值 不 是 None， 它 将 被 内 建 的 repr() 画 数 转 换 为 一 个 字符 串 ， 产 生 的 字符 串 
被 宇 到 标准 输出 (参见 print 语 句 ) 的 一 行 上 。 (生成 None 的 表达 式 不 会 被 输出 ， 因 此 过 程 调 
用 不 会 带 来 任何 输出 。) 


6.2. 赋值 语句 


赋值 语句 用 于 〈 重 新 ) 绑 定 名 称 到 具体 的 值 以 及 修改 可 变 对 象 的 属性 或 元 素 : 


assignment_stmt : (target_list "=")+ (expression_list | yield_expression) 
target ("," target)* [","] 

identifier 

| "(" target list ")" 

| "[" target list "]" 

| attributeref 


target list 


target 


| subscription 
| slicing 


《最 后 三 种 符号 的 定义 参见 初级 操作 一 节 。) 


赋值 语句 计算 expression_ list ( 记 住 ， 它 可 以 是 一 个 单一 的 表达 式 也 可 以 是 一 个 去 号 分 隔 的 序 
列 ， 后 者 生成 一 个 元 组 ) 并 且 从 左 到 右 把 单一 的 结果 对 象 赋值 给 target_list 的 每 一 个 元 素 。 


赋值 是 递归 定义 的 ， 取 决 于 目标 (序列 ) 的 形式 。 当 目标 是 可 变 对 象 的 一 部 分 时 (属性 引 
用 ， 下 标 或 者 切片 ) ， 最 终 必 须 由 该 可 变 对 象 做 赋值 操作 并 决定 其 合法 性 ， 如 果 赋 值 不 可 接 
受 可 以 抛 出 一 个 异常 。 各 种 类 型 遵守 的 规则 以 及 抛 出 的 异常 根据 对 象 类 型 的 定义 给 出 (参见 
标准 类 型 的 层次 一 节 ) 。 


赋值 一 个 对 象 给 一 个 目标 序列 按 如 下 方式 递归 定义 : 


e. 如 果 对 象 列表 是 单一 的 目标 : 对 象 赋值 给 该 目标 。 

e 如 果 目 标 序列 是 喜 号 分 隔 的 序列 : 对 象 必须 是 可 迭代 的 且 元 素 个 数 与 目标 序列 中 目标 个 
数 相同 ， 然 后 元 素 从 左 向 右 赋 值 给 对 应 的 目标 。 

赋值 一 个 对 象 给 一 个 单一 的 目标 按 如 下 方式 递 当 定 义 。 

e 如 果 目 标 是 一 个 标识 符 (名称) 

e 如 果 名 称 没 有 出 现在 当前 代码 块 的 global 语 句 中 : 名 称 绑 定 到 当前 局 部 命名 空间 中 的 对 
象 。 

e 否则 : 名 称 绑 定 到 当前 全 局 命名 空间 的 对 象 。 

如 果 名 称 已 经 绑 定 ， 那 么 它 将 重新 绑 定 。 这 可 能 导致 之 前 绑 定 到 该 名 称 的 对 象 的 引用 计数 变 

为 需 ， 引 起 该 对 象 被 释放 并 调用 它 的 析 构 函数 (如果 有 的 话 ) o 

e 如 果 目 标 是 一 个 包含 在 圆 括号 或 者 方 括号 中 的 目标 序列 : 对 象 必须 是 可 迭代 的 且 元 素 个 
数 与 目标 序列 中 目标 个 数 相同 ， 然 后 元 素 从 左 向 右 赋值 给 对 应 的 目标 。 


e 如 果 目 标 是 属性 引用 : 计算 引用 中 的 初级 表达 式 。 它 产生 的 对 象 应 该 具有 一 个 可 以 赋值 
的 属性 ; 如 果 情 况 不 是 这 样 ， 则 抛 出 TypeError 有 异常 。 然 后 要 求 该 对 象 将 被 赋值 的 对 象 赋 
值 给 给 定 的 属性 ; 如 果 不 能 做 此 操作 ， 它 会 抛 出 一 个 异常 (通常 是 AttributeError， 但 不 
一 定 ) 。 


注意 : 如 果 对 象 是 类 的 实例 且 属 性 引用 出 现在 赋值 运算 符 的 两 侧 ， 那 么 右 侧 的 表达 式 a.x 既 可 
以 访问 实例 属性 《如果 不 存在 实例 属性 ) 也 可 以 访问 类 属性 。 左 侧 的 目标 将 a.x 永 远 设 置 成 实 
例 的 属性 ， 如 果 必 要 将 创建 它 。 因 此 ，a.x 的 两 次 出 现 不 是 一 定 会 引用 同一 个 属性 : MRA Ml 
表达 式 引用 的 是 一 个 类 属性 ， 左 侧 的 表达 式 将 创建 一 个 新 的 实例 属性 作为 赋值 的 目标 。 


class Cls: 
x= 3 # class variable 
inst = Cls() 
inst.x = inst.x + 1 # writes inst.x as 4 leaving Cls.x as 3 


这 里 的 描述 不 一 定 适用 描述 器 属性 ， 例 如 property() 创 建 的 属性 。 


。 如 果 目 标 是 下 标 操作 符 : 计算 引用 中 的 初级 表达 式 。 它 应 该 生成 一 个 可 变 的 序列 对 象 
(例如 列表 ) 或 者 映射 对 象 (例如 字典 ) 。 然 后 ， 计 算 下 标 表达 式 。 


如 果 primary 是 一 个 可 变 的 序列 对 象 〈 例 如 一 个 列表 ) ， 则 下 标 必 须 产 生 一 个 普通 的 整数 。 如 
果 它 是 负数 ， 将 会 加 上 序列 的 长 度 。 结 果 值 必须 是 一 个 小 于 序列 长 度 的 非 负 整数 ， 然 后 将 要 
求 序列 赋值 该 对 象 给 具有 那个 索引 的 元 素 。 如 果 索 引 超 出 范围 ， 则 引发 IndexError 有 异常 (给 序 
列 下 标 赋值 不 能 添加 新 的 元 素 到 序列 中 ) 。 


如 果 primary 是 一 个 映射 对 象 〈 例 如 一 个 字典 ) ， 下 标 必 须 具 有 和 了 映射 的 关键 字 类 型 兼容 的 类 
型 ， 然 后 要 求 映 射 创 建 一 个 键 / 值 对 将 下 标 映 射 到 赋值 的 对 象 。 这 既 可 以 替换 一 个 具有 相同 键 
值得 已 存在 键 / 值 对 ， 也 可 以 插入 一 个 新 的 键 / 值 对 (如果 不 存在 相同 的 键 ) 。 


。 如 果 目 标 是 一 个 切片 : 计算 引用 中 的 初级 表达 式 。 它 应 该 产生 一 个 可 变 序列 对 象 〈 例 如 
列表 ) 。 被 赋值 的 对 象 应 该 是 相同 类 型 的 序列 对 象 。 下 一 步 ， 如 果 存 在 ， 则 计算 下 边界 
和 上 边界 表达 式 ; 默认 是 雾 和 序列 的 长 度 。 边 界 计算 的 值 应 该 是 〈 小 ) 整数 。 如 果 任 意 
一 个 边界 为 复数 ， 则 会 给 它 加 上 序列 的 长 度 。 结 果 求 得 的 边界 在 雳 和 序列 的 长 度 之 间 ， 
包括 边界 在 内 。 最 后 ， 要 求 序列 对 象 用 赋值 的 序列 元 素 蔡 换 切片 。 切 片 的 长 度 可 能 不 同 
于 赋值 的 序列 的 长 度 ， 因 此 如 果 对 象 允许 则 改变 目标 序列 的 长 度 。 


CPython 实 现 细节 : 在 目前 的 实现 中 ， 目 标的 语法 和 表达 式 的 语法 相同 ， 不 合法 的 语法 将 在 
代码 生成 阶段 被 排除 ， 导 致 不 够 详细 的 错误 信息 。 


警告 : 虽然 赋值 的 定义 暗示 左 侧 和 右 侧 之 间 的 交叉 赋值 是 安全 的 '〈 例 如 ，a,b=b,a 交 换 两 个 变 
量 ) ， 但 是 赋值 目标 集 的 内 部 有 交叉 则 是 不 安全 的 ! 例如 ， 下 面 的 程序 将 打印 [0,2] : 


x = [0, 1] 
i=0 

mx [E = al, 2 
print x 


6.2.1. 增强 的 赋值 语句 


增强 的 赋值 是 将 二 元 操作 和 赋值 语句 组 合成 一 个 单一 的 语句 。 


augmented_assignment_stmt : augtarget augop (expression_list | yield_expression) 
identifier | attributeref | subscription | slicing 
wae | "=" | mx 一 | = | “yan | Mor | Wk eT 


| ">z" | "<<=" | "oz" | "Az" | " | =z" 


augtarget 


augop 


(最 后 三 个 符号 的 语法 定义 参见 初级 操作 一 节 。) 


增强 的 赋值 将 先 求 值 target (和 普通 的 赋值 语句 不 同 ， 它 不 可 以 是 一 个 可 拆 分 的 对 象 ) 和 
expression list, "acd 作 数 的 二 元 操作 ， 最 后 将 结果 赋值 给 初始 的 target。 
target 只 计算 一 


像 x+=1 这 样 增强 的 赋值 表达 式 可 以 重 写成 x=x+1 以 达到 类 似 但 不 完全 等 同 的 效果 。 在 增强 版 本 
中 ，x 只 计算 一 次 。 还 有 ， 如 果 可 能 ， 真 实 的 操作 是 原 地 的 ， 意 思 是 不 创建 一 个 新 的 对 象 并 赋 
值 给 target， 而 是 直接 修改 旧 的 对 象 。 


除了 不 可 以 在 一 个 语句 中 赋值 给 元 组 和 多 个 目标 ， 增 强 的 赋值 语句 完成 的 赋值 和 普通 的 赋值 
以 相同 的 方式 处 理 。 类 似 地 ， 除 了 可 能 出 现 的 原 地 行为 ， 增 强 的 赋值 完成 的 二 元 操作 和 普通 
的 二 元 操作 相同 。 


如 果 target 是 属性 引用 ， 关 于 类 和 实例 属性 的 注意 事项 同样 适用 于 正常 的 赋值 。 
6.3. assert 语句 
Assert 语 句 是 插入 调试 断言 到 程序 中 的 一 种 便捷 方法 : 


assert_stmt ::= "assert" expression ["," expression] 


其 简单 形式 ，assertexpression， 等 同 于 


if | debug . 
if not expression: raise AssertionError 


其 扩展 形式 ，assertexpression1,expression2， 等 同 于 


if | debug . 
if not expressioni: raise AssertionError(expression2) 


这 些 等 价 的 语句 假定 debug 和 AssertionError 引 用 的 是 同名 的 内 建 变量 。 在 当前 的 实现 中 ， 内 
建 的 变量 debug 在 正常 情况 下 为 为 True， 在 要 求 优化 时 (MATAA -0) 为 False。 在 编译 时 
刻 ， 当 要 求 优化 时 ， 目 前 的 代码 生成 器 不 会 为 断言 语句 生成 任何 代码 。 注 : 不 必 把 失败 的 表 
达 式 的 源 代 码 包含 进 错误 信息 ; 它 将 作为 栈 回 溯 的 一 部 分 显示 出 来 。 


给 debug 赋 值 是 非法 的 。 内 建 变量 的 值 在 解释 器 启动 的 时 候 就 已 决定 。 
6.4. pass 语句 


pass_stmt ::= "pass" 


pass 是 一 个 空 操作 一 执行 它 的 时 候 ， 什 么 都 没有 发 生 。 它 的 用 义 是 当 语 法 上 要 求 有 一 条 语句 
但 是 不 需要 执行 任何 代码 的 时 候 作 为 占 位 符 ， 例 如 : 
def f(arg): pass # a function that does nothing (yet) 


class C: pass # a class with no methods (yet) 


6.5. del 语句 


del_stmt ::= "del" target_list 


删除 是 递 为 定义 的 ， 和 赋值 的 定义 方式 非常 相似 。 这 里 就 不 详细 讲述 完整 的 细节 ， 只 给 出 一 
些 注意 事项 。 


删除 目标 将 从 左 向 右 递 为 删除 每 一 个 目标 。 


删除 一 个 名 称 将 从 局 部 或 全 局 命名 空间 中 删除 该 名 称 的 绑 定 ， 取 决 于 名 称 是 否 出 现在 相同 代 
码 块 的 global 语 句 中 。 如 果 名 称 没有 绑 定 ， 将 抛 出 一 个 NameError 异常 。 


如 果 名 称 作为 自由 变量 出 现在 嵌 套 的 代码 块 中 ， 从 局 部 命名 空间 中 删除 它 是 非法 的 。 


属性 引用 、 下 标 和 切片 的 删除 将 传递 给 原始 的 对 象 ; 切片 的 删除 在 一 般 情况 下 等 同 于 赋予 一 
个 右边 类 型 的 空 切片 (但 即使 这 点 也 是 由 切片 的 对 象 决定 ) 。 


6.6. print 语句 


print_stmt ::= "print" ([expression ("," expression)* [","]] 
| ">>" expression [("," expression)+ [","]]) 


print 依 次 计算 每 一 个 表达 式 并 将 求 得 的 对 象 宇 入 标准 输出 (参见 下 文 ) 。 如 果 对 象 不 是 字符 
串 ， 那 么 首先 使 用 字符 串 转 换 规则 将 它 转换 成 字符 串 。 然 后 输出 ( 求 得 的 或 者 原始 的 ) 字符 
Po E (RAM) 输出 每 个 对 象 之 前 会 输出 一 个 空格 ， 除 非 输 出 系统 认为 它 位 于 一 行 的 开 
始 。 这 些 情况 包括 (1) 还 没有 字符 写 入 到 标准 输出 ， Q0) 写 入 到 标准 输出 的 最 后 一 个 字符 
是 除 "以 外 的 空白 字符 ， 或 者 (3) 最 后 向 标准 输出 写 人 的 操作 不 是 print 语 句 。 (在 某 些 情 况 下 
由 于 这 个 原因 向 标准 输出 宇 入 一 个 空白 字符 串 可 能 是 有 用 的 。) 


Apa angie 
TER 


行为 像 文 件 对 象 但 是 不 是 内 建 的 文件 对 象 的 对 象 通常 不 会 恰当 地 模拟 文件 对 象 的 这 方面 行 
为 ， 所 以 最 好 不 要 依赖 这 个 行为 。 


在 结尾 会 写 入 一 个 \n' 字 符 ， 除 非 print 语 名 以 逗号 结束 。 如 果 语 句 只 包含 关键 字 print， 这 将 是 
唯一 的 行为 。 


标准 输出 定义 为 内 建 模块 sys 中 名 为 stdout 的 对 象 。 如 果 不 存 在 该 对 象 ， 或 者 它 没 有 write() 方 
法 ， 将 抛 出 一 个 RuntimeError 异 常 。 


print 同 样 有 一 种 扩展 的 形式 ， 由 上 面 描 述 的 语法 的 第 二 部 分 定义 。 这 种 形式 有 时 被 称 为 “print 
chevron. "在 这 种 形式 中 ，>> 之 后 的 第 一 个 表达 式 必须 是 一 个 “类 文件 "对 象 ， 具 体 点 就 是 具有 
上 面 提 到 的 write() 方 法 的 对 象 。 通 过 这 种 扩展 形式 ， 随 后 的 表达 式 被 输入 到 该 文件 对 象 。 如 果 
第 一 个 表达 式 求 值 为 None， 那 么 使 用 sys.stdout 作 为 输出 的 文件 。 


6.7. return 语句 


return_stmt ::= "return" [expression_list] 


return 在 语法 上 只 可 以 出 现在 函数 定义 中 ， 不 可 以 出 现在 类 定义 中 。 

如 果 存 在 expression list， 则 计算 它 ， 否 则 使 用 None 蔡 换 。 

return 离 开 当 前 的 函数 调用 时 以 expression_list (或 None) 作为 返回 值 。 

当 return 将 控制 传 出 带 有 finally 子 句 的 try 语 句 时 ， 在 真正 离开 函数 之 前 会 执行 fnally 子 句 。 


在 生成 器 函数 中 ，return 语 句 不 允许 包含 expression_list。 在 这 种 情况 下 ， 空 的 return 表 明生 成 
器 已 经 完成 并 闻 导 致 Stoplteration 异 常 抛 出 。 


6.8. yield 语句 


yield_stmt ::= yield_expression 


vield## OD LESE 3L ^E PX da EXHI [8 FH, BREERAEWAHHAADER. FERRE 
用 yield 语 句 就 足以 创建 一 个 生成 器 函数 而 不 是 普通 函数 。 


当 调 用 生成 器 画 数 时 ， 它 返回 一 个 称 为 生成 器 迭代 器 的 迭代 器 ， 或 者 通常 就 叫做 生成 器 。 生 
成 器 函数 体 的 执行 通过 重复 调用 生成 器 的 next() 方 法 直到 它 抛 出 一 个 异常 。 


当 执 行 一 个 yield 语 句 时 ， 生 成 器 的 状态 将 冻结 起 来 并 且 将 expression_list 的 值 返 回 给 next() 的 
AAA. “冻结 "的 意思 是 所 有 局 部 的 状态 都 会 被 保存 起 来 ， 包 括 当前 局 部 变量 的 绑 定 、 指 今 指 
针 、 内 部 的 计算 栈 : 保存 足够 的 信息 以 使 得 下 次 调用 next() 时 ， 画 数 可 以 准确 地 继续 ， 就 像 


yield 语 句 只 是 另外 一 个 外 部 调用 。 

从 Python 2.5 版 开始 ，yield 语 句 人 允许 在 出 现在 try ... finally 结 构 的 try 子 句 中 。 如 果 生 成 器 在 终 
te (引用 数 达 到 需 或 者 被 当 作 垃 圾 回收 ) 之 前 没有 恢复 ， 将 调用 生成 器 迭代 器 的 close() 方 
法 ， 这 人 允许 任何 挂 起 的 finally 子 句 可 以 执行 。 

yield 语 义 的 完整 细节 ， 参 考 Yie/d 表 达 式 一 节 。 

注意 

在 Python 2.2 中 ，yield 语 句 只 有 当 generators 功 能 启用 了 时 才 人 允许 。future 导 入 语句 用 来 启用 
该 功能 : 


from _ future A. import generators 


另 请 参阅 


PEP 0255 - 简单 的 生成 器 添加 生成 器 和 yield 语 句 到 Python 中 的 提议 。PEP 0342 - 通过 增强 的 
生成 器 实现 协 程 该 提议 提出 ， 除 了 其 它 的 生成 器 的 增强 之 外 ， 人 允许 yield 出 现在 try ... finally 代 
码 块 的 内 部 。 


6.9. raise 语句 


raise stmt ::= "raise" [expression ["," expression ["," expression] ]] 


如 果 没 有 表达 式 ，raise 重新 抛 出 当前 作用 域 中 最 后 一 个 激活 的 异常 。 如 果 当 前 作用 域 中 没有 
活着 的 异常 ， 则 抛 出 TypeError 异 常 以 表示 这 是 一 个 错误 (如 果 在 IDLE 中 运行 ， 则 会 抛 出 
Queue.Empty 异 常 ) 。 


否则 ，raise 计 算 后 面 的 表达 式 以 得 到 三 个 对 象 ， 使 用 None 作 为 省 略 的 表达 式 的 值 。 前 面 的 两 
个 对 象 用 于 决定 异常 的 类 型 和 值 。 


如 果 第 一 个 对 象 是 一 个 实例 ， 那 么 异常 的 类 型 是 实例 的 类 ， 实 例 本 身 是 值 ， 第 二 个 对 象 必 须 
是 None。 


如 果 第 一 个 对 象 是 一 个 类 ， 那 么 它 将 成 为 异常 的 类 型 。 第 二 个 对 象 用 于 决定 异常 的 值 : 如 果 
它 是 类 的 实例 ， 那 么 该 实例 将 成 为 异常 的 值 。 如 果 第 二 个 对 象 是 一 个 元 组 ， 它 用 于 类 构造 琅 
数 的 参数 列表 ; 如 果 它 是 None， 则 使 用 一 个 空 的 参数 列表 ， 如 果 是 其 它 任 何 对 象 则 被 当做 构 
造 本 数 的 一 个 单一 的 参数 。 通 过 调用 构造 本 数 创建 的 实例 特 用 作 该 异常 的 值 。 


如 果 存 在 第 三 个 对 象 且 不 为 None， 那 么 它 必须 是 一 个 回溯 对 象 (参见 标准 类 型 的 层次 一 
4), 且 它 将 替换 当前 异常 发 生 的 位 置 。 如 果 存 在 第 三 个 对 象 且 值 不 是 回溯 对 象 或 者 None,， 
将 会 抛 出 TypeError 异常 。 具 有 三 个 表达 式 形 式 的 raise 用 于 在 except 子 句 中 显 式 地 重新 抛 出 异 


常 ， 但 是 如 果 重 新 抛 出 的 异常 是 当前 作用 域 中 最 近 激 活 的 异常 则 应 该 优先 使 用 不 带 表 达 式 的 


raise。 


关于 异常 的 更 多 信息 可 以 在 异常 一 节 中 找到 ， 如 何 处 理 异常 的 信息 在 ty 语句 一 节 。 


6.10. break 语句 


break_stmt ::= "break" 


break 在 语法 上 只 可 以 出 现在 for 或 者 while 循 环 中 ， 但 不 能 蔚 套 在 这 些 循环 内 的 画 数 和 类 定义 
中 。 


它 终止 最 相近 的 循环 ， 如 果 循 环 有 else 子 句 将 跳 过 
如 果 break 终 止 了 一 个 for 循 环 ， 控 制 循 环 的 目标 保持 当前 的 值 。 
当 break 将 控制 传 出 带 有 finally 子 句 的 try 语 名 时， 在 离开 循环 之 前 会 执行 finally 子 句 。 


6.11. continue 语句 


continue_stmt ::= "continue" 


continue 3& 3E E A m] EA HH s fEforsXwhileff&zr rh, (AR REREE X E818 9r PBSERAAGE 类 
定义 和 finally 子 句 中 。 它 继续 最 内 层 循 环 的 下 一 轮 。 


当 continue 将 控制 传 出 带 有 finally 子 句 的 try 语 名 时， 在 真正 开始 下 一 轮 循环 之 前 会 执行 fnally 
子 句 。 


6.12. import 语句 


import_stmt ::= "import" module ["as" name] ( "," module ["as" name] )* 
"from" relative module "import" identifier ["as" name] 

"," identifier ["as" name] )* 

"from" relative module "import" "(" identifier ["as" name] 


一 — 一 一 


identifier ["as" name ] ye ME "ys 


"from" module "import" "*" 


module := (identifier ".")* identifier 
relative module ::- "."* module | "."+ 
name := identifier 


import 语 句 分 两 步 执 行 : (1) 找到 模块 ， 如 果 必 要 则 进行 初始 化 ; (2) 定义 (import 语 句 所 
在 作用 域 的 ) 局 部 命名 空间 中 的 名 称 。 该 语句 有 两 种 形式 ， 区 别 在 于 有 没有 使 用 from 关 键 
字 。 第 一 种 形式 〈 没 有 from) 针对 序列 中 的 每 个 标识 符 重 复 执 行 这 些 步骤 。 具 有 from 的 形式 


将 先 执行 一 次 步骤 (1) ， 然 后 重复 执行 步骤 0). 


为 了 理解 步骤 (1) 如 何 发 生 ， 你 必须 首先 理解 Python 如 何 义理 模块 的 分 层 命 名 。 为 了 帮助 组 
织 模块 并 提供 一 套 命名 的 层级 ，Python 有 一 个 包 的 概念 。 包 可 以 包含 其 它 包 和 模块 ， 但 是 模 
块 不 可 以 包含 其 它 模块 或 者 包 。 从 文件 系统 的 角度 ， 包 是 目录 而 模块 是 文件 。 原 始 的 包 的 说 
明 仍 然 可 以 阅读 ， 尽 管 自从 该 文档 的 编写 以 来 小 的 细节 已 经 发 生 了 变化 。 


一 旦 知道 模块 的 名 字 (除非 特别 指出 ，“ 模 块 ”这 个 词 兼 指 包 和 模块 )， 模 块 或 者 包 的 搜索 就 可 
以 开始 。 首 先 检 查 的 地 方 是 sys.modules， 这 里 是 之 前 已 经 导入 的 所 有 模块 的 缓存 。 如 果 找 到 
该 模块 ， 那 么 将 在 导入 的 步骤 (2) 使 用 它 。 


如 果 在 缓存 中 没有 找到 该 模块 ， 则 搜索 sys.meta_path (sys.meta_path 的 说 明 可 以 在 PEP 302 
中 找到 ) 。 该 对 象 是 finder 对 象 的 一 个 列表 ， 通 过 以 模块 的 名 称 调用 它们 的 findmodule() 方 法 
可 以 知道 如 何 加 载 模 块 。 如 果 模 块 正好 包含 在 某 个 包 中 (由 名 称 中 存在 的 点 号 表示 ) , BA 
父 包 中 的 _path 属 性 将 作为 find_module() 第 二 个 参数 给 出 〈 正 在 导入 的 模块 的 名 字 中 ， 最 后 一 
个 点 号 之 前 的 所 有 内 容 ) 。 如 果 某 个 finder 能 够 找到 该 模块 ， 它 将 返回 一 个 /oader (后 面 讨 
论 ) 或 者 None。 


If none of the finders on sys.meta_path are able to find the module then some implicitly 
defined finders are queried.Implementations of Python vary in what implicit meta path finders 
are defined.The one they all do define, though, is one that handles sys.path hooks, 

sys.path importer cache, and sys.path. 


The implicit finder searches for the requested module in the "paths" specified in one of two 
places (“paths” do not have to be file system paths).If the module being imported is 
supposed to be contained within a package then the second argument passed to 
findmodule(), path on the parent package, is used as the source of paths.If the module is 
not contained in a package then sys.path is used as the source of paths. 


Once the source of paths is chosen it is iterated over to find a finder that can handle that 
path.The dict at sys.path importer cache caches finders for paths and is checked for a 
finder.If the path does not have a finder cached then sys.path hooks is searched by calling 
each object in the list with a single argument of the path, returning a finder or raises 
ImportError.If a finder is returned then it is cached in sys.path importer cache and then 
used for that path entry.If no finder can be found but the path exists then a value of None is 
stored in sys.path importer cache to signify that an implicit, file-based finder that handles 
modules stored as individual files should be used for that path.If the path does not exist then 
a finder which always returns None is placed in the cache for the path. 


If no finder can find the module then ImportError is raised.Otherwise some finder returned a 
loader whose load module() method is called with the name of the module to load (see PEP 
302 for the original definition of loaders).A loader has several responsibilities to perform on a 
module it loads.First, if the module already exists in sys.modules (a possibility if the loader is 
called outside of the import machinery) then it is to use that module for initialization and not 


a new module.But if the module does not exist in sys.modules then it is to be added to that 
dict before initialization begins.If an error occurs during loading of the module and it was 
added to sys.modules it is to be removed from the dict.If an error occurs but the module was 
already in sys.modules it is left in the dict. 


The loader must set several attributes on the module.name is to be set to the name of the 
module .file is to be the "path" to the file unless the module is built-in (and thus listed in 
sys.builtin module names) in which case the attribute is not set.If what is being imported is 
a package then path is to be set to a list of paths to be searched when looking for modules 
and packages contained within the package being imported.package is optional but should 
be set to the name of package that contains the module or package (the empty string is 
used for module not contained in a package).loader is also optional but should be set to the 
loader object that is loading the module. 


If an error occurs during loading then the loader raises ImportError if some other exception is 
not already being propagated. Otherwise the loader returns the module that was loaded and 
initialized. 


SOR (0) 结束 时 没有 抛 出 异常 ， 步 又 (2) 就 可 以 开始 。 


import 语 句 的 第 一 种 形式 将 局 部 命名 空间 中 的 模块 名 绑 定 到 模块 对 象 ， 然 后 如 果 有 下 一 个 标识 
符 则 继续 导入 。 如 果 模 块 后 面 带 有 as， 则 as 后 面 的 名 称 将 用 于 模块 的 局 部 名 称 。 


from 形 式 不 绑 定 模块 的 名 称 : 它 通 历 标识 符 序 列 ， 在 步骤 (1) 中 找到 的 模块 中 逐一 查找 它 
们 ， 然 后 绑 定 局 部 命名 空间 中 的 名 称 到 找到 的 对 象 。 与 第 一 种 形式 的 import 类 似 ， 可 以 通 
过 “as localname” 提 供 另 外 一 个 名 称 。 如 果 找 不 到 名 称 ， 则 引发 ImportError。 如 果 用 星 号 (*) 
蔡 换 标识 符 序 列 ， 那 么 模块 中 定义 的 所 有 公开 的 名 称 都 将 被 绑 定 到 import 语 句 所 在 的 局 部 命名 


空间 。 


模块 定义 的 公开 的 名 称 通过 检查 模块 命名 空间 中 一 个 名 为 all 的 变量 决定 ; 如 果 定 义 ， 它 必须 
是 一 个 字符 串 序列 ， 它 们 是 该 模块 定义 或 者 导 和 人 的 名 称 。all 中 给 出 的 名 称 都 被 认为 是 公开 的 
且 要 求 必须 存在 。 如 果 all 没 有 定义 ， 那 么 公开 的 名 称 集合 包括 模块 命名 空间 中 找到 的 所 有 不 
是 以 下 划 线 字符 (开始 的 名 称 。_ay// 应 该 包含 全 部 的 公开 API。 它 的 意图 是 避免 意外 地 导出 不 
是 API 的 部 分 (例如 模块 内 部 导入 和 使 用 的 库 模块 ) 。 


带 有 的 from 形式 只 可 以 出 现在 模块 作用 域 中 。 如 果 通 配 符 形式 的 导入 一 import — FR 
用 并 且 函 数 包含 或 者 是 一 个 带 有 自由 变量 的 谋 套 代码 块 ， 编 译 器 将 抛 出 SyntaxError。 


在 指出 你 要 导入 的 模块 时 ， 你 不 必 指 明 模 块 的 绝对 路 径 名 。 当 一 个 模块 或 者 包 包 含 在 另外 一 
个 包 中 时 ， 可 以 在 同一 个 等 级 的 包 中 使 用 相对 导 和 人 而 不 需要 提 及 包 的 名 字 。 通 过 在 from 之 后 
指定 的 模块 或 包 中 使 用 前 导 的 点 号 ， 你 可 以 指定 相对 当前 包 层 级 向 上 


7. 复合 语句 


复合 语句 包含 (多 组 ) 其 它 语句 ; 它们 以 某 种 方式 影响 或 者 控制 其 它 那些 语句 的 执行 。 通 
常 ， 复 合 语句 跨越 多 行 ， 虽 然 一 条 完整 的 复合 语句 可 以 用 简洁 的 形式 包含 在 一 行 之 中 。 


if、while 和 for 语 句 实现 传统 的 控制 流 句法 结构 。try 指 出 一 组 语句 的 异常 处 理 器 和 /或 清理 代 
码 。 酌 数 和 类 定义 在 语法 上 同样 也 是 复合 语句 。 


合 语句 由 一 个 或 多 个 子 句 ' 组 成 。 一 条 子 句 由 语句 首 和 ' 语 句 组 ' 组 成 。 一 条 特定 的 复合 语句 的 
所 有 子 句 的 语句 首都 处 在 相同 的 缩 进 水 平 上 。 每 一 个 子 句 的 语句 首 以 一 个 唯一 的 标识 关键 字 
开始 并 以 冒号 结束 。 语 句 组 是 由 一 条 子 句 控制 的 一 组 语句 。 一 个 语句 组 可 以 是 语句 首 冒 号 之 
后 的 同一 行 上 紧 跟 一 个 或 多 个 分 号 分 隔 的 简单 语句 ， 也 可 以 是 后 续 行 上 一 个 或 多 个 缩 进 的 语 
句 。 只 有 后 一 种 形式 的 语句 组 可 以 包含 谋 套 的 复合 语句 ; 下 面 的 语句 是 非法 的 ， 最 主要 是 因 
为 不 能 明确 随后 的 else 子 句 属于 哪 一 个 if 子 句 : 


if testi: if test2: print x 


同时 要 注意 在 该 上 下 文中 分 号 的 优先 级 比 冒号 高 , 所 以 在 下 面 的 例子 中 ， 要 么 执行 所 有 的 print 


if x< y < z: print x; print y; print z 


总 结 
compound stmt ::- if stmt 
| while stmt 
| for stmt 
| try stmt 
| with stmt 
| funcdef 
| classdef 
| decorated 
suite := stmt list NEWLINE | NEWLINE INDENT statement+ DEDENT 
statement := stmt list NEWLINE | compound stmt 
stmt list := simple stmt (";" simple stmt)* [";"] 


注意 语句 永远 以 NEWLINE 结 束 ， 其 后 可 能 跟随 一 个 DEDENT。 还 要 注意 可 选 的 续 行 子 句 永远 
以 一 个 不 能 作为 语句 开始 的 关键 字 开始 ， 因 此 不 会 有 歧义 (' 基 挂 的 else’' 问 题 在 Python 中 通过 
要 求 庶 套 的 if 语句 必须 缩 进 得 到 解决 ) 。 


为 了 清晰 起 见 ， 下 面 小 节 中 的 语法 规则 的 格式 会 将 子 句 放 在 单独 的 一 行 。 


7.1. if 语句 


if 语句 用 于 条 件 执行 : 


if_stmt ::= "if" expression ":" suite 
( "elif" expression ":" suite )* 
["else" ":" suite] 
它 通过 对 表达 式 逐 个 求 值 直到 其 中 一 个 为 真 的 方式 准确 地 选择 一 个 语句 组 〈《 真 和 假 的 定义 参 
见 布尔 操作 一 节 ) ; 然后 执行 这 个 语句 组 〈if 语 名 的 其 它 部 分 不 会 被 执行 或 求 值 ) 。 如 果 所 有 
表达 式 都 为 假 ， 则 执行 else 子 句 的 语句 组 。 


7.2. while 语句 
while 语 句 用 于 重复 执行 直到 某 个 表达 式 为 真 : 


while stmt ::= "while" expression ":" suite 
["else" ":" suite] 


它 重复 测试 表达 式 ， 如 果 为 真 ， 则 执行 第 一 个 语句 组 ; 如 果 表 达 式 为 假 〈 可 能 是 第 一 次 测 
ji), ， 则 执行 else 子 句 且 终止 循环 。 


第 一 个 语句 组 中 执行 的 break 语 名 会 终止 循环 而 不 执行 else 子 句 的 语句 组 。 在 第 一 个 语句 组 中 
执行 的 continue 语 句 会 跳 过 语句 组 中 剩余 的 语句 并 返回 继续 测试 表达 式 。 


7.3. for 语句 
for 语 句 用 于 迭代 一 个 序列 的 元 素 (例如 字符 串 、 元 组 或 者 列表 ) 或 者 其 它 可 迭代 的 对 象 : 


for_stmt ::= "for" target_list "in" expression_list ":" suite 
["else" ":" suite] 


表达 式 列 表 值 计算 一 次 ; 它 应 当 产 生 一 个 可 迭代 的 对 象 。expression list 的 结果 创建 一 个 迭代 
器 。 然 后 以 索引 的 升序 为 顺序 ， 为 迭代 器 提供 的 每 个 元 素 执行 一 次 语句 组 。 每 个 元 素 使 用 标 
准 的 赋值 规则 被 赋值 给 目标 列表 ， 然 后 执行 语句 组 。 当 元 素 取 尽 时 〈 如 果 序列 为 空 则 立刻 取 
尽 ) ， 则 执行 else 子 句 中 的 语句 组 并 终止 循环 。 


第 一 个 语句 组 中 的 break 语 名 会 终止 循环 而 不 执行 else 子 句 的 语句 组 。 在 第 一 个 语句 组 中 执行 
的 continue 语 句 会 跳 过 语句 组 的 剩余 语句 并 继续 下 一 个 元 素 ， 如 果 没 有 下 一 个 元 素 则 继续 执 
行 else 子 句 。 


语句 组 可 以 给 目标 列表 中 的 变量 赋值 ; 这 不 影响 下 一 个 赋值 给 它 的 元 素 。 


当 循 环 结 束 时 目标 序列 不 会 被 删除 ， 但 是 如 果 序 列 为 空 ， 循 环 不 会 赋 任 何 值 给 它 。 提 示 : A 
建 的 range() 范 数 返回 整数 的 序列 ， 它 适用 于 模拟 Pascal 语言 中 fori:=atobdo 效 果 ; 例如 ， 
range(3) 返回 列表 [0,1,2]。 

注意 

当 序 列 被 循环 修改 时 ， 会 发 生 微妙 的 事情 (只 有 可 变 类 型 的 序列 会 发 生 ， 例 如 列表 ) 。 有 一 
个 内 部 计数 器 用 于 跟踪 下 一 轮 循环 使 用 哪 一 个 元 素 ， 并 且 每 次 迭代 中 会 增加 。 当 计数 器 达到 
序列 的 长 度 时 循环 终止 。 这 意味 着 如 果 语 句 组 从 序列 中 删除 当前 (或 者 前 面 的 ) 元 素 ， 下 一 
个 元 素 将 被 跳 过 (因为 它 获 取 当 前 已 经 被 处 理 过 的 元 素 的 索引 ) 。 同 样 地 ， 如 果 语 句 组 在 序 
列 中 当前 元 素 之 前 插入 一 个 元 素 ， 那 么 当前 元 素 将 在 下 一 次 循环 被 再 次 处 理 。 这 可 能 导致 难 
以 觉察 的 错误 ， 但 可 以 通过 使 用 整个 序列 的 切片 生成 临时 拷贝 避免 这 个 问题 ， 例 如 ， 


for x in a[:]: 
if x < 0: a.remove(x) 


7.4. try 语句 


try 语 句 为 一 组 语句 指定 异常 处 理 器 和 /或 清理 代码 : 


try_stmt = try1 stmt | try2 stmt 
try1 stmt ::= "try" ":" suite 
("except" [expression [("as" | ",") target]] ":" suite)+ 
["else" ":" suite] 
["finally" ":" suite] 
try2 stmt ::= "try" ":" suite 
"finally" ":" suite 


版 本 2.5 中 的 新 变化 : 在 以 前 版 本 的 Python Hi, try...except...finally RIE, try...excepti^ fi 
PEE try...finally-A, 


except 子 句 指 定 一 个 或 多 个 异常 处 理 器 .。 当 try 子 句 中 没有 出 现 异常 时 ， 不 会 执行 异常 处 理 

器 。 当 try 语 句 组 中 出 现 异常 时 ， 开 始 搜 索 异常 处 理 器 。 搜 索 依 次 检查 异常 子 句 直 到 找到 与 异 
常 匹 配 的 一 个 。 没 有 表达 式 的 异常 子 句 ， 如 果 出 现 ， 必 须 放 在 最 后 ; 它 匹 配 任 何 异 常 。 对 于 
一 个 带 有 表达 式 的 异常 子 句 ， 该 表达 式 将 被 求 值 ， 如 果 结 果 对 象 与 异常 “兼容 "， 则 认为 子 句 与 
异常 匹配 。 对 象 与 异常 兼容 ， 如 果 它 是 异常 对 象 的 类 或 基 类 或 者 是 一 个 包含 与 异常 兼容 的 元 
素 的 元 组 。 


如 果 没 有 except 子 句 匹 配 到 异常 ， 异 常 处 理 器 的 搜索 将 继续 在 外 层 代 码 和 调用 栈 上 进行 。[1] 


如 果 计 算 except 子 句 头 部 的 一 个 表达 式 引 发 了 异常 ， 那么 就 会 中 断 原 异常 处 理 器 的 搜索 ， 而 
EXER SARA RRR Ries 《就 好 像 是 整个 try 语 句 发生 了 异常 一 样 ) 。 


:43:8J—^ ^ LacMexceptf ant, FHM Rizexcepf DANA, fAmdTexcepT- TH 
语句 组 。 所 有 的 异常 子 句 必须 具有 一 个 可 执行 的 代码 块 。 当 到 达 该 代码 块 的 结尾 时 ， 在 真 个 
try 语 句 之 后 执行 正常 继续 。 (这 意味 着 如 果 同 一 个 异常 存在 两 个 嵌 套 的 处 理 器 ， 且 异常 发 生 
在 内 部 处 理 器 的 try 子 句 中 ， 那 么 外 边 的 处 理 器 不 会 处 理 这 个 异常 。) 


在 执行 except 子 句 的 语句 组 之 前 ， 异 常 的 详细 信息 被 赋值 给 Sys 模块 中 的 三 个 变量 : 
sys.exc_type 接 收 标识 异常 的 对 象 ; sys.exc_value 接 收 异 常 的 参数 ; sys.exc_traceback 接 收 
一 个 回溯 对 象 (参见 标准 类 型 的 层级 一 节 ) 指示 程序 中 异常 发 生 的 点 。 这 些 详细 信息 也 可 以 
通过 sys.exc_info() 画 数 得 到 ， 它 返回 一 个 元 组 (exc_type,exc_value,exc_traceback)。 鼓 励 使 
用 这 个 函数 而 不 鼓励 使 用 对 应 的 变量 ， 因 为 在 多 线程 程序 中 它们 的 使 用 是 不 安全 的 。 从 
Python 1.5 开始 ， 这 些 值 会 在 处 理 异 常 的 了 汞 数 返 回 时 会 恢复 它们 之 前 的 值 (调用 之 前 的 
值 ) 。 


如 果 控 制 流 从 try 子 名 的 结尾 出 来 时 ， 则 执行 可 选 的 else 子 句 。[2]else 子 句 中 的 异常 不 会 被 前 面 
的 except 子 句 义 理 。 


如 果 有 finally 出 现 ， 它 指定 一 个 “清除 "处 理 器 。 首 先 执 行 try 子 句 被 执行 ， 然 后 包括 任何 except 
和 else 子 句 。 如 果 异 常 发 生 在 任何 子 句 中 且 没 有 被 处 理 ， 那 么 异常 会 被 临时 保存 起 来 。 最 后 执 
行 fnally 子 句 。 如 果 有 保存 的 异常 ， 它 会 在 finally 子 句 结束 时 被 重新 抛 出 。 如 果 finally 抛 出 另外 
一 个 异常 或 者 执行 一 个 return 或 break 语 句 ， 那 么 保存 的 异常 会 被 丢弃 : 


>>> def f(): 
try: 
1/0 
finally: 
return 42 


ah 
42 
在 finally 子 句 执 行 过 程 中 程序 访问 不 到 异常 信息 。 


当 return、break 或 continue 语 句 在 try...finally 语 句 的 try 语 句 组 中 被 执行 ，finally 子 句 在 ‘出 口 ' 处 
同样 被 执行 。continue 语 句 出 现在 finally 子 句 中 是 非法 的 。 (原因 是 当前 实现 的 问题 一 该 限制 
在 未 来 可 能 会 去 掉 ) 。 


函数 的 返回 值 取 决 于 执行 的 最 后 一 条 return 语 句 。 因 为 finally 子 名 会 永远 执行 ， 在 finally 子 句 中 
执行 的 return 语 名 将 永远 是 最 后 执行 的 一 条 语句 : 


>>> def foo(): 
try: 
return 'try' 
finally: 
return 'finally' 


>>> foo() 


'finally' 


额外 的 信息 可 以 在 异常 一 节 中 找到 ， 关 于 如 何 使 用 raise 语 名 产生 异常 可 以 在 /raise 语句 一 节 中 
找到 。 
7.5. with 语句 


出 现 于 版 本 2.5。 


with 用 于 和 上 下 文 管理 器 定义 的 方法 一 起 封装 代码 块 的 执行 (参见 With 语 句 的 上 下 文 管理 器 一 
节 ) 。 这 人 允许 常见 的 try...except...finally 的 用 法 模式 封装 起 来 以 方便 地 重用 。 


with_stmt : 


with_item : 


"with" with_item ("," with_item)* ":" suite 
expression ["as" target] 


带 有 一 个 "item" 的 with 语句 的 执行 按 下 面 的 方式 进行 : 

1. 计算 上 下 文 表达 式 (with_item 中 给 出 的 表达 式 ) 以 获得 一 个 上 下 文 管理 器 。 
2. 加载 上 下 文 管理 器 的 exit() 方 法 留 着 后 面 使 用 。 

3. 调用 上 下 文 管理 器 的 enter() 方 法 。 

4， 如 果 with 语 名 包含 一 个 目标 ，enter() 的 返回 值 将 赋值 给 它 。 
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with 语句 保证 如 果 enter() 方 法 没有 错误 返回 ， 那 么 exit() 将 永远 被 调用 。 因 此 ， 如 果 在 给 目标 
列表 赋值 过 程 中 出 现 错误 ， 它 将 被 与 语句 组 中 发 生 的 错误 同样 对 待 。 参 见 下 面 的 第 6 步 。 


1， 执 行 语 句 组 。 


2. 调用 上 下 文 管理 器 的 exit() 方 法 。 如 果 有 异常 导致 语句 组 要 退出 ， 那 么 异常 的 类 型 、 值 和 回 
溯 栈 被 当做 参数 传递 给 exit()。 否 则 ， 提 供 三 个 None 参数 。 


如 果 语 句 组 由 于 异常 退出 ， 且 exit() 方 法 的 返回 值 为 假 ， 异 常 料 被 重新 引发 。 如 果 返 回 值 为 
真 ， 异 常 将 被 取消 ， 并 继续 执行 with 语 句 之 后 的 语句 。 


如 果 语 句 组 由 于 异常 以 外 的 其 它 任何 原因 退出 ，exit() 的 返回 值 将 被 忽略 ， 执 行将 在 退出 发 生 
的 正常 位 置 继续 。 


WRASTRA, EPRXEGZGB)AGEMBBE EB Twithi&  : 


with A() as a, B() as b: 
suite 


等 同 于 


with A() as a: 
with B() as b: 
suite 
注意 


在 Python 2.5 中 ，with 只 有 在 with_statement 特 性 被 启用 的 时 候 才 允许 使 用 。 在 Python 2.6 
中 ， 它 被 永远 启用 。 


版 本 2.7 中 的 新 变化 : 支持 多 个 上 下 文 表 达 式 。 
另 请 参阅 


PEP 0343 - “with” 语 句 Python with 语 句 的 说 明 、 背 景 和 实例 。 


7.6. 函数 定义 


画 数 定义 定义 一 个 用 户 自 定 义 的 函数 对 象 (参见 标准 类 型 的 层次 一 节 ): 


decorated ::= decorators (classdef | funcdef) 

decorators ::=  decorator+ 

decorator ::=  "Q" dotted name ["(" [argument list [","]] ")"] NEWLINE 
funcdef ::= "def" funcname "(" [parameter list] ")" ":" suite 
dotted name ::= identifier ("." identifier)* 

parameter list ::- (defparameter ",")* 


( "*" identifier ["," "**" identifier] 
| "**" identifier 
| defparameter [","] ) 


defparameter ::= parameter ["=" expression] 
sublist ::= parameter ("," parameter)* [","] 
parameter ::= identifier | "(" sublist ")" 
funcname ::= identifier 


FRAGE LE-ATI 5), CHATS E SRS j8] PHARMA 0 — I ES 24081 
R (WAAKRAKSHAS) 。 画 数 对 象 包含 一 个 对 当前 全 局 命名 空间 的 引用 ， 作 为 函数 调 
用 时 使 用 的 全 局 命名 空间 。 


函数 定义 不 会 执行 函数 体 ; 它 只 有 在 调用 函数 的 时 候 才 执行 。[3] 


男 数 定义 可 能 被 一 个 或 多 个 修饰 符 表 达 式 封装 。 修 饰 符 表达 式 在 画 数 定义 时 于 包含 画 数 定义 
的 定义 域 中 求 值 。 求 值 的 结果 必须 是 一 个 可 调用 对 象 ， 它 以 该 琅 数 对 象 为 唯一 的 参数 。 调 用 
的 返回 值 绑 定 在 汞 数 名 而 不 是 男 数 对 象 上 。 多 个 修饰 符 是 以 启 套 的 方式 作用 的 。 例 如 ， 下 面 
的 代码 : 


@fi1(arg) 
Qf2 
def func(): pass 


等 同 于 : 


def func(): pass 
func = f1(arg)(f2(func) ) 


当 一 个 或 多 个 最 上 层 的 参数 具有 parameter=expression 的 形式 时 ， 称 该 玉 数 具有 “默认 参数 
值 。 "对 于 具有 默认 值 的 参数 ， 对 应 的 参数 在 调用 时 可 以 省 略 ， 在 这 种 情况 下 使 用 参数 的 黑 认 
值 。 如 果 一 个 参数 具有 默认 值 ， 所 有 随后 的 参数 也 必须 具有 默认 值 一 这 个 限制 在 语法 中 没有 
表达 出 来 的 。 


默认 的 参数 值 在 执行 画 数 定义 是 求 值 。 这 意味 着 只 在 函数 定义 的 时 候 该 表达 式 求 一 次 值 ， 以 
后 每 次 调用 使 用 相同 的 “提前 计算 好 的 " 值 。 这 对 于 理解 默认 参数 是 可 变 对 象 时 特别 重要 ， 例 如 
列表 或 字典 : 如 果 画 数 修改 了 该 对 象 〈 例 如 ， 向 列表 添加 一 个 元 素 ) ， 默 认 值 将 受 影响 被 修 
改 。 这 通常 不 是 想 要 的 。 一 种 变通 的 方法 是 使 用 None 作 为 默认 值 ， 然 后 在 函数 体 中 明确 地 测 
RB, BIAN : 


def whats_on_the_telly(penguin=None): 
if penguin is None: 
penguin = [] 
penguin.append("property of the zoo") 
return penguin 


函数 调用 的 语义 在 调用 一 节 有 更 详细 的 描述 。 画 数 调用 永远 会 给 参数 列表 中 的 所 有 的 参数 赋 
值 ， 无 论 是 位 置 参 数 还 是 关键 宇 参数 或 默认 值 。 如 果 出 现 “identifier” 的 形式 ， 那 么 它 被 初始 化 
为 一 个 可 以 接收 任意 多 余 位 置 参 数 元 组 ， 默 认为 空 元 组 。 如 果 有 “identifier” 的 形式 ， 那 么 它 被 
初 识 化 为 一 个 可 以 接收 任意 的 多 余 关 键 字 参 数 的 新 的 字典 ， 默 认 值 为 空 字典 。 


也 可 以 创建 匿名 画 数 (没有 绑 定 到 某 个 名 称 的 函数 ) ， 以 在 表达 式 中 直接 使 用 。 它 使 用 
lambda 表达 式 ， 在 Lamboas 一 节 中 有 详细 描述 。 注 意 lambda 表达 式 仅 仅 是 简单 的 画 数 定义 
的 简写 ; “def" 语 句 中 定义 的 函数 和 lambda 表达 式 定义 的 函数 一 样 ， 可 以 传递 或 者 赋值 给 另外 
一 个 名 称 。 “de? 形式 事实 上 功能 更 强大 ， 因 为 它 允 许 执行 多 条 语句 。 


程序 员 的 注意 事项 : 本 数 是 第 一 级 的 对 象 。 在 函数 内 部 执行 的 "def "形式 定义 一 个 可 以 被 返回 
或 传递 的 局 部 画 数 。 在 府 套 的 画 数 中 使 用 的 自由 变量 可 以 访问 包含 该 def 的 函数 的 局 部 变量 。 
详细 信息 参 e 见 名 称 和 绑 定 一 节 。 


7.7. 类 定义 


类 定义 定义 一 个 类 对 象 (参见 标准 类 型 的 层次 一 节 ) 


classdef := "class" classname [inheritance] ":" suite 
inheritance ::- "(" [expression list] ")" 
classname := identifier 


类 定义 是 一 个 可 执行 语句 。 它 首先 计算 inheritance 序 列 ， 如 果 存 在 的 话 。inheritance 序 列 中 的 
每 一 项 都 应 该 是 一 个 类 对 象 或 者 允许 生成 子 类 的 类 类 型 。 然 后 使 用 一 个 新 创建 的 局 部 命名 空 
间 和 初始 的 全 局 命名 空间 ， 在 新 的 执行 帧 中 执行 类 的 语句 组 〈 参 见 名 称 和 绑 定 一 节 ) 。 GB 
常 ， 语 句 组 只 包含 图 数 的 定义 。) 当 类 的 语句 组 结束 执行 ， 它 的 执行 帧 被 丢弃 但 是 局 部 命名 
空间 被 保存 下 来 。[4] 最 后 使 用 inheritance 序 列 作 为 基 类 创建 一 个 类 对 象 ， 并 保存 局 部 命名 空 
间作 为 属性 字典 。 类 的 名 称 被 绑 定 到 初 识 局 部 命名 空间 中 类 对 象 。 


程序 员 的 注意 事项 : 类 定义 中 定义 的 变量 是 类 变量 ; 它们 被 所 有 的 实例 共享 。 要 创建 实例 变 
量 ， 可 以 在 方法 中 使 用 self.name=value 设 置 它们 。 类 变量 和 实例 变量 都 可 以 通 

过 “self.name” 记 号 访问 ， 当 用 相同 的 方式 访问 时 实例 变量 将 隐藏 相同 名 称 的 类 变量 。 类 变量 
可 以 作为 实例 变量 的 默认 值 使 用 ， 但 是 这 种 用 法 如 果 使 用 可 变 的 值 可 能 导致 意 想不到 的 结 
果 。 对 于 新 式 类 ， 可 以 使 用 描述 符 创建 具 有 不 同 实现 细节 的 实例 变量 。 


类 定义 ， 类 似 于 函数 定义 ， 可 以 被 一 个 或 多 个 描述 符 表达 式 封 装 。 描 述 符 表 达 式 的 计算 规则 
和 男 数 相同 。 结 果 必 须 是 一 个 类 对 象 ， 并 绑 定 于 类 的 名 字 。 


脚注 
[1] 异常 将 扩散 到 调用 栈 除非 finally 子 句 硬 巧 引 发 另外 一 个 异常 。 这 个 新 的 异常 导致 旧 
9 异常 去 失 。 
[2] 目前 ， 控 制 “ 从 末尾 流出 ”除了 下 面 这 些 情况 : 异常 或 执 
行 return、continue、break 语 句 。 
[3] 作为 函数 体 第 一 条 语句 出 现 的 字符 串 字 面值 被 转换 成 函数 的 doc 属 性 ， 即 函数 的 文 
档 字 符 串 。 


| [4] | 作为 类 体 的 第 一 条 语句 出 现 的 语句 被 转换 为 该 命名 空间 的 doc 属 性 ， 即 类 的 文档 字符 
Be p 


8. 顶层 的 组 件 


Python 解释 器 可 以 从 多 个 源 获 取 输 入 : 从 以 标准 输入 或 者 程序 参数 传递 给 它 的 脚本 ， 
和 输入， 模块 源 文 件 等 。 本 章 给 出 这 些 情况 下 使 用 的 语法 。 


Kt 
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8.1. 完整 的 Python 程序 


虽然 语言 的 规范 不 需要 规定 语言 的 解释 器 如 何 被 调用 ， 但 是 对 完整 的 Python 程序 有 一 个 概念 
是 很 有 用 的 。 一 个 完整 的 Python 程序 在 一 个 最 小 初始 化 的 环境 中 执行 : 可 以 访问 所 有 的 内 建 
和 标准 模块 ， 但 是 ， 除 了 sys (各 种 系统 服务 ) ，builtin (ABBA, SHA None) 以 及 
main， 都 没有 初始 化 。 后 者 用 来 给 完整 的 程序 的 执行 提供 局 部 和 全 局 命名 空间 。 


完整 的 Python 程序 的 语法 用 于 文件 输入 ， 在 下 面 的 小 节 中 讲述 。 


解释 器 可 能 也 会 在 交互 模式 下 被 调用 ; 在 这 种 情况 下 ， 它 不 会 读 取 并 执行 一 个 完整 的 程序 ， 
但 是 它 会 一 次 读 取 并 执行 一 条 语句 〈 可 以 是 复合 语句 ) 。 它 的 初 识 环境 和 完整 的 程序 是 完 
一 样 的 ; 每 一 条 语句 在 main 命 名 空间 中 执行 。 

在 Unix 下 ， 一 个 完整 的 程序 可 用 三 种 形式 传递 给 解释 器 : 带 有 -cstring 的 命令 行 选项 ， 以 文件 
传递 的 第 一 个 命令 行 参 数 ， 或 者 以 标准 输入 。 如 果 文 件 或 者 标准 输入 是 一 个 tty 设备 ， 解 释 器 
将 进入 交互 模式 ; 否则 ， 它 执行 文件 作为 一 个 完整 的 程序 。 


8.2. 文件 输入 
所 有 从 非 交 互 式 文件 读 取 的 输入 都 具有 相同 的 形式 : 
file input ::= (NEWLINE | statement)* 


该 语法 用 在 以 下 的 情形 : 


e 当 解 析 一 个 完整 的 Python 程序 (从 一 个 文件 或 者 一 个 字符 串 ) 
e 当 解 析 一 个 模块 ; 
e 当 解 析 一 个 传递 给 exec 语 句 的 字符 串 ; 


8.3. 交互 式 输入 
交互 模式 下 的 输入 使 用 下 面 的 语法 解析 : 


interactive input ::= [stmt list] NEWLINE | compound stmt NEWLINE 


注意 (ME) 组 件 的 语句 在 交互 模式 下 后 面 必须 跟随 一 个 空格 ; 它 可 以 帮助 解析 器 检测 到 输 
入 的 结束 。 


8.4. 表达 式 输 入 


有 两 种 形式 的 表达 式 输入 。 两 种 形式 都 忽略 前 导 的 空格 。eval() 的 字符 串 参 数 必须 具有 以 下 的 
形式 : 


eval input ::- expression list NEWLINE* 


由 input() 读 取 的 输入 行 必 须 具 有 以 下 的 形式 : 


input input ::- expression_list NEWLINE 


TA: ATARRABIA, COCOIDSRIANEBUEgaw input) 或 者 文件 对 
象 的 readline()。 


9. 完整 的 语法 规范 
这 是 完整 的 Python 语法 ， 它 由 解析 器 读 人 用 于 解析 Python 源 文件 : 


# Grammar for Python 


Note: Changing the grammar specified in this file will most likely 
require corresponding changes in the parser module 
(../Modules/parsermodule.c). If you can't make the changes to 
that module yourself, please co-ordinate the required changes 
with someone who can; ask around on python-dev for help. Fred 
Drake <fdrake@acm.org> will probably be listening there. 


# NOTE WELL: You should also follow all the steps listed in PEP 306, 
# "How to Change Python's Grammar" 


# Start symbols for the grammar: 

# single_input is a single interactive statement; 

# file input is a module or sequence of commands read from an input file; 
# eval_input is the input for the eval() and input() functions. 

# NB: compound_stmt in single_input is followed by extra NEWLINE! 

single input: NEWLINE | simple stmt | compound stmt NEWLINE 

file input: (NEWLINE | stmt)* ENDMARKER 

eval input: testlist NEWLINE* ENDMARKER 


decorator: 'Q' dotted name [ '(' [arglist] ')' ] NEWLINE 
decorators: decorator+ 
decorated: decorators (classdef | funcdef) 
funcdef: 'def' NAME parameters ':' suite 
parameters: '(' [varargslist] ')' 
varargslist: ((fpdef ['=' test] ',')* 
('*' NAME [',' '**' NAME] | '**' NAME) | 
fpdef ['=' test] (',' fpdef ['=' test])* [',']) 
fpdef: NAME | '(' fplist ')' 
fplist: fpdef (',' fpdef)* [','] 


stmt: simple stmt | compound stmt 
simple stmt: small stmt (';' small stmt)* [';'] NEWLINE 
small stmt: (expr stmt | print stmt | del stmt | pass stmt | flow stmt | 
import stmt | global stmt | exec stmt | assert stmt) 
expr stmt: testlist (augassign (yield expr|testlist) | 
('=' (yield expr|testlist))*) 
augassig SG = = eoe es oll es pid 
I C E ln) 
# For normal assignments, additional restrictions enforced by the interpreter 
print stmt: 'print' ( [ test (',' test)* [','] ] | 
">>" test [ (',' test)+ [','] ] ) 
del stmt: 'del' exprlist 
pass stmt: 'pass' 
flow stmt: break stmt | continue stmt | return stmt | raise stmt | yield stmt 


break stmt: 'break' 
continue stmt: 'continue' 
return stmt: 'return' [testlist] 
yield stmt: yield expr 
raise stmt: 'raise' [test [',' test [',' test]]] 
import stmt: import name | import from 
import name: 'import' dotted as names 
import from: ('from' ('.'* dotted name | '.'+) 
'import' ('*' | '(' import as names ')' | import as names)) 
import as name: NAME ['as' NAME] 
dotted as name: dotted name ['as' NAME] 
import as names: import as name (',' import as name)* [','] 
dotted as names: dotted as name (',' dotted as name)* 
dotted name: NAME ('.' NAME)* 
global stmt: 'global' NAME (',' NAME)* 
exec stmt: 'exec' expr ['in' test [',' test]] 
assert stmt: 'assert' test [',' test] 


compound stmt: if stmt | while stmt | for stmt | try stmt | with stmt | funcdef | classde 


if stmt: 'if' test ':' suite ('elif' test ':' suite)* ['else' ':' suite] 
while stmt: 'while' test ':' suite ['else' ':' suite] 
for stmt: 'for' exprlist 'in' testlist ':' suite ['else' ':' suite] 
try stmt: ('try' ':' suite 
((except clause ':' suite)+ 
['else' ':' suite] 
['finally' ':' suite] | 
'finally' ':' suite)) 
with stmt: 'with' with item (',' with item)* ':' suite 


with item: test ['as' expr] 

4 NB compile.c makes sure that the default except clause is last 
except clause: 'except' [test [('as' | ',') test]] 

suite: simple stmt | NEWLINE INDENT stmt+ DEDENT 


# Backward compatibility cruft to support: 

4 [ x for x in lambda: True, lambda: False if x() ] 
# even while also allowing: 

4 lambda x: 5 if x else 2 

# (But not a mix of the two) 

testlist safe: old test [(',' old test)+ [',']] 

old test: or test | old lambdef 

old lambdef: 'lambda' [varargslist] ':' old test 


test: or test ['if' or test 'else' test] | lambdef 
or test: and test ('or' and test)* 

and test: not test ('and' not test)* 

not test: 'not' not test | comparison 

comparison: expr (comp op expr)* 

comp op: '«'|'»'|'2z'|'»z'|'«z'|'«»'|'!z'|'in'|'not' 'in'J'is'|'is' 'not' 
expr: xor expr ('|' xor expr)* 

xor expr: and expr ('^' and expr)* 

and expr: shift expr ('&' shift expr)* 

shift expr: arith expr (('<<'|'>>') arith expr)* 
arith expr: term (('+'|'-') term)* 


term: factor (('*'|'/'|'%'|'//') factor)* 
factor: ('+'|'-'|'~') factor | power 
power: atom trailer* ['**' factor] 
atom: ('(' [yield_expr|testlist_comp] ')' | 
'[' [listmaker] ']' | 
'(' [dictorsetmaker] '}' | 
TD Pasig (73 | 
NAME | NUMBER | STRING+) 
listmaker: test ( list_for | (',' test)* [','] ) 
testlist comp: test ( comp for | (',' test)* [','] ) 


lambdef: 'lambda' [varargslist] ':' test 

trailer: '(' [arglist] ')' | '[' subscriptlist ']' | '.' NAME 
subscriptlist: subscript (',' subscript)* [','] 

subscript: '.' '.' '.' | test | [test] ':' [test] [sliceop] 
sliceop: ':' [test] 


exprlist: expr (',' expr)* [','] 

testlist: test (',' test)* [','] 

dictorsetmaker: ( (test ':' test (comp for | (',' test ':' test)* [','])) | 
(test (comp for | (',' test)* [','])) ) 


classdef: 'class' NAME ['(' [testlist] ')'] ':' suite 


arglist: (argument ',')* (argument [','] 
|'** test (',' argument)* [',' '**' test] 
|***" ‘test) 
# The reason that keywords are test nodes instead of NAME is that using NAME 
# results in an ambiguity. ast.c makes sure it's a NAME. 
argument: test [comp_for] | test '=' test 


list_iter: list_for | list_if 

list_for: 'for' exprlist 'in' testlist_safe [list_iter] 
list if: 'if' old test [list iter] 

comp iter: comp for | comp if 

comp for: 'for' exprlist 'in' or test [comp iter] 

comp if: 'if' old test [comp iter] 


testlist1: test (',' test)* 


# not used in grammar, but may appear in "node" passed from Parser to Compiler 
encoding decl: NAME 


yield expr: 'yield' [testlist] 
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Python 3 教程 


Python 是 一 门 简单 易学 、 功 能 强大 的 编程 语言 。 它 具有 高 效 的 高 级 数据 结构 和 简单 而 有 效 的 
面向 对 象 编程 方法 。 Python 优雅 的 语法 和 动态 类 型 、 以 及 其 解释 性 的 性 质 ， 使 它 在 许多 领域 
和 大 多 数 平台 成 为 脚本 编写 和 快速 应 用 程序 开发 的 理想 语言 。 


从 Python 网 站 http://www.python.org/ 可 以 免费 获得 所 有 主要 平台 的 源 代码 或 二 进 制 形式 的 
Python 解释 器 和 广泛 的 标准 库 ， 并 且 可 以 自由 地 分 发 。 网 站 还 包含 许多 免费 的 第 三 方 Python 
模块 、 程序 、 工 具 以 及 附加 文档 的 发 布 包 和 链接 。 


Python 解释 器 可 以 用 C SX C++ (或 可 从 C 中 调用 的 其 他 语言 ) 中 实现 的 新 的 函数 和 数据 
类 型 轻松 扩展 。Python 也 适合 作为 可 定制 应 用 程序 的 一 种 扩展 语言 。 


本 教程 非 正 式 向 读者 介绍 Python 语言 及 其 体系 的 基本 概念 和 功能 。 随手 使 用 Python 解释 器 
来 亲自 动手 是 很 有 帮助 的 ， 但 所 有 示例 都 是 自 包 含 的 ， 所 以 本 教程 也 可 以 离线 阅读 。 


有 关 标 准 对 象 和 模块 的 说 明 ， 请 参阅 Python 标准 库 。Python 语 言 参考 给 出 了 Python 语言 的 更 
正式 的 定义 。 要 编写 C 或 C+ + 的 扩展 ， 请 阅读 扩展 和 艇 入 Python 解释 器 与 PythomC APIS 
考 手 册 。 也 有 几 本 书 深度 地 介绍 了 Python 。 

本 教程 不 会 尝试 全 面 地 涵盖 每 一 个 单独 特性 ， 甚 至 即使 它 是 常用 的 特性 。 相 反 ， 它 介绍 了 许 
多 Python 的 值得 注意 的 特性 ， 从 而 能 让 你 很 好 的 把 握 这 门 语言 的 特性 。 经 过 学 习 ， 你 将 能 够 
阅读 和 编写 Python 的 模块 和 程序 ， 并 可 以 更 好 的 学 会 Python 标准 库 中 描述 的 各 种 Python 
库 模 块 。 


词汇 表 也 值得 浏览 一 下 。 


1.515 


如 果 你 要 用 计算 机 做 很 多 工作 ， 最 终 你 发 现 是 有 一 些 您 希望 自动 执行 的 任务 。 例 如 ， 你 可 能 
希望 对 大 量 的 文本 的 文件 执行 搜索 和 蔡 换 ， 或 以 复 条 的 方式 重 命名 并 重新 排列 一 堆 照 片 文 
件 。 也 许 你 想 写 一 个 小 的 自 定义 数据 库 ， 或 一 个 专门 的 GUI 应 用 程序 或 一 个 简单 的 游戏 。 


如 果 你 是 一 个 专业 的 软件 开发 人 员 ， 您 可 能 必须 使 用 几 个 C/C++/Java 库 ， 但 发 现 通常 的 
编写 /编译 /测试 /重新 编译 周期 太 慢 。 也 许 你 要 写 这 样 的 库 中 的 测试 套件 ， 然 后 发 现 编写 测试 代 
码 是 很 乏味 的 工作 。 或 也 许 您 编写 了 一 个 程序 ， 它 可 以 使 用 一 种 扩展 语言 ， 但 你 不 想 为 您 的 
应 用 程序 来 设计 与 实现 一 个 完整 的 新 语言 。 


Python 正 是 这 样 为 你 准备 的 语言 。 


你 可 以 为 其 中 一 些 任务 写 一 个 Unix shell 脚本 或 Windows 批 处 理 文件 ， 但 是 shell 脚本 最 适 
合 处 理 文件 移动 和 文本 编辑 ， 而 不 适用 于 GUI 应 用 程序 和 游戏 。 你 可 以 写 一 个 C/C+ 
+/Java 程序 ， 但 是 甚至 程序 的 第 一 个 初稿 都 可 能 花费 大 量 的 开发 时 间 。Python 更 简单 易 用 ， 
可 用 于 Windows、 Mac OS X 和 Unix 操作 系统 ， 并 将 帮助 您 更 快 地 完成 工作 。 


Python 使 用 很 简单 ， 但 它 是 一 个 真正 的 编程 语言 ， 比 shell 脚本 或 批 处 理 文 件 对 于 大 型 的 程 
序 提供 更 多 的 结构 和 支持 。 另 一 方面 ，Python 还 提供 了 比 C 更 多 的 错误 检查 ， 并 且 ， 作 为 一 
种 高 级 语言 ， 它 有 内 置 的 高 级 数据 类 型 ， 上 比如 灵活 的 数组 和 字典 。 因 为 其 更 加 一 般 的 数据 类 
型 ， Python tt Awk 甚至 Perl 适用 于 很 多 更 大 的 问题 领域 ， 而 且 很 多 事情 在 Python 中 至 少 
和 那些 语言 一 样 容易 。 


Python 允许 您 将 您 的 程序 拆 分 成 可 以 在 其 他 Python 程序 中 重复 使 用 的 模块 。 它 拥有 大 量 的 
标准 模块 ， 你 可 以 将 其 用 作 你 的 程序 的 基础 一 或 者 作为 学 习 Python 编程 的 示例 。 这 些 模块 
提供 诸如 文件 VO. 系统 调用 、 套 接 字 和 其 至 用 户 图 形 界面 接口 ， 例 如 Tk。 


Python 是 一 门 解 释 性 的 语言 ， 因 为 没有 编译 和 链接 ， 它 可 以 节省 你 程序 开发 过 程 中 的 大 量 时 
igo Python 解释 器 可 以 交互 地 使 用 ， 这 使 得 试验 Python 语言 的 特性 、 编 写 用 后 即 扔 的 程序 或 
在 自 底 向 上 的 程序 开发 中 测试 功能 非常 容易 。 它 也 是 一 个 方便 的 桌面 计算 器 。 


Python 使 程序 编写 起 来 能 够 紧凑 和 可 读 。 编 写 的 Python 程序 通常 比 等 价 的 C、 C++ 或 
Java 程序 短 很 多 ， 原 因 有 几 个 : 


e 高 级 数据 类 型 允许 您 在 单个 语句 中 来 表达 复杂 的 操作 ; 
e 语句 分 组 是 通过 缩 进 ， 而 不 是 开始 和 结束 的 括号 ; 
e 任何 变量 或 参数 的 声明 不 是 必要 的 。 


Python 是 可 扩展 的 : 如 果 你 知道 如 何 用 C 编程 ， 那 么 将 很 容易 添加 一 个 新 的 内 置 西数 或 模块 
到 解释 器 中 ， 要 么 为 了 以 最 快 的 速度 执行 关键 的 操作 ， 要 么 为 了 将 Python 程序 与 只 有 二 进 制 
形式 的 库 (如 特定 供应 商 提供 的 图 形 库 ) 链接 起 来 。 一 旦 你 真 的 着 迷 ， 你 可 以 把 Python 解释 
器 链接 到 C 编写 的 应 用 程序 中 ， 并 把 它 当 作 那 个 程序 的 扩展 或 命令 行 语 言 。 


顺便 说 一 句 ，Python 语言 的 名 字 来 自 于 BBC f “Monty Python's Flying Circus" $5 El, 51617 
动物 无 关 。 在 文档 中 引用 Monty Python HAR RAL, FAS ! 

既然 现在 你 们 都 为 Python 感到 兴奋 ， 你 们 一 定 会 想 更 加 详细 地 研究 它 。 学 习 一 门 语言 最 好 的 
方法 就 是 使 用 它 ， 本 教程 推荐 你 边 读 边 使 用 Python 解释 器 练习 。 

在 下 一 章 中 ， 我 们 将 解释 Python 解释 器 的 用 法 。 这 是 很 简单 的 一 件 事情 ， 但 它 有 助 于 试验 后 
面 的 例子 

本 教程 的 其 余部 分 通过 实例 介绍 了 Python 语言 和 体系 的 各 种 特性 ， 以 简单 的 表达 式 、 语句 
和 数据 类 型 开始 ， 然 后 是 函数 和 模块 ， 最 后 讲述 高 级 概念 ， 如 异常 和 用 户 自 定 义 的 类 。 


2. Python 解释 器 


2.1 调用 解释 器 


Python 解释 器 在 可 用 的 机 器 上 通常 安装 成 /usr/local/bin/python3.4 ; 将 /usr/local/bin 放 在 您 的 
Unix shell 搜索 路 径 ， 使 得 可 以 通过 在 shell Het A MD 


python3.4 


来 启动 它 。[1] 由 于 解释 器 放置 的 目录 是 一 个 安装 选项 ， 其 他 地 方 也 是 可 能 的 ; 请 与 您 的 
Python 专家 或 系统 管理 员 联 系 。 (例如 ， /usr/local/python 是 一 个 常见 的 替代 位 置 。 


在 Windows 机 器 上 ，Python 的 安装 通常 是 放置 在 C:\Python3， 当 然 你 可 以 在 运行 安装 程序 时 
进行 更 改 。 你 可 以 在 一 个 DOS 窗 口 的 命令 提示 符 下 键 人 以 下 命令 来 把 这 个 目录 添加 到 路 径 
中 : 


set path=%path%;C:\python34 


主 提示 符 下 键入 文件 结束 字符 (Unix 上 是 Control-D 、 Windows 上 是 Control-Z) 会 导致 该 
解释 器 以 需 退 出 状态 退出 。 如 果 无 法 正常 工作 ， 您 可 以 通过 键入 以 下 命令 退出 解释 器 : 
duit()。 


编辑 器 的 行 编辑 功能 包括 交互 式 编辑 ， 历 史记 录 和 代码 补 全 ， 其 中 代码 补 全 功能 需要 系统 支 
持 readline 库 。 也 许 最 快 的 检查 ， 看 看 是 否 支 持 命令 行 编辑 对 你 的 第 一 个 Python 提示 Ctrl-P。 
如 果 它 发 出 蜂 鸣 声 ， 则 有 命令 行 编辑 ; 请 参阅 附录 交互 式 输 入 编辑 和 历史 蔡 代 的 有 关 快 捷 键 
的 介绍 。 如 果 什 么 都 没 发 生 ， 或 者 显示 ^ P， 命 邻 行 编辑 不 可 用 ; 你 就 只 能 够 使 用 退 格 键 删除 
当前 行 中 的 字符 。 


解释 器 有 些 像 Unix shell : 当 使 用 tty 设 备 作 为 标准 输入 调用 时 ， 它 交互 地 读 取 并 执行 命 分 ; 
当 用 文件 名 参数 或 文件 作为 标准 输入 调用 ， 它 将 读 取 并 执行 该 文件 中 的 脚本 。 


第 二 种 启动 解释 器 的 方式 是 python-ccommand[arg]..， 这 种 方式 是 在 command 中 执行 语句 ， 
类 似 于 shell 的 -c 选 项 中 。 因 为 Python 语句 经 常 包含 空格 或 其 他 shell 特殊 字符 ， 通 常 建议 把 
全 部 命令 放 在 单 引 号 里 。 


At Python 模块 同时 也 是 可 执行 的 脚本 。 这 些 模块 可 以 使 用 python-mmodule[arg]..…. 直 接 调 
用 ， 这 和 在 命令 行 输入 完整 的 路 径 名 执行 模块 的 源 文件 是 一 样 的 。 


当 使 用 一 个 脚本 文件 时 ， 它 有 时 是 很 有 用 能 够 运行 该 脚本 ， 之 后 进入 交互 模式 。 这 可 以 通过 
在 脚本 前 面 加 上 - 选项 实现 。 


2.1.1. 参数 传递 


调用 解释 器 时 ， 脚 本 名 称 和 其 他 参数 被 转换 成 一 个 字符 串 列 表 并 赋值 给 sys 模 块 中 的 argv 变 
量 。 你 可 以 通过 importsys 访 问 此 列表 。 列 表 的 长 度 是 至 少 是 1 ; 如 果 没 有 给 出 脚本 和 参数 ， 
sys.argv[0] 是 一 个 空 字符 串 。 当 使 用 -c 命 舍 时 ， sys.argv[0] 设 置 为 '-c。 当 使 用 -mm 模块 参数 
at, sys.argv[0] 被 设 定 为 指定 模块 的 全 名 。-c 选 项 或 -m 选 项 后 面 的 选项 不 会 被 Python 解释 器 
处 理 ， 但 是 会 被 保存 在 sys.argv 中 ， 供 命令 或 模块 使 用 。 


2.1.2. 交互 模式 


当 从 tty 读 取 命令 时 ， 我 们 说 解释 器 在 交互 模式 下 。 这 种 模式 下 ， 解 释 器 以 主 提示 符 提示 输 
入 命令 ， 主 提示 符 通 常 标识 为 三 个 大 于 号 (>>>) ; 如 果 有 续 行 ， 解 释 器 以 从 提示 符 提示 输 
入 ， 默 认为 三 个 点 (…)。 在 第 一 个 提示 符 之 前 ， 解 释 器 会 打印 出 一 条 欢迎 信息 声明 它 的 版 本 号 
和 授权 公告 : 


$ python3 .4 

Python 3.4 (default, Mar 16 2014, 09:25:04) 

[GCC 4.8.2] on linux 

Type "help", "copyright", "credits" or "license" for more information. 
>>> 


输入 多 行 结构 时 需要 续 行 。 作 为 一 个 例子 ， 看 看 这 个 if 语句 : 


>>> the world is flat = True 
>>> if the world is flat: 
print("Be careful not to fall off!") 


Be careful not to fall off! 


2.2. 解释 器 及 其 环境 


2.2.1. 错误 义理 


着 误 发 生 时 ， 解 释 器 会 打印 错误 信息 和 堆栈 跟踪 信息 。 在 交互 模式 下 ， 它 会 返回 到 主 提示 
符 ; 当 输 入 来 自 一 个 文件 ， 它 会 打印 堆栈 跟踪 信息 ， 然 后 以 非 需 退出 状态 退出 。 (由 try 语 名 
中 except 的 子 句 处 理 的 异常 不 是 在 这 方面 的 错误 ) 。 有 些 错误 是 致命 的 并 导致 非 需 状态 退 
出 ; 这 通常 由 于 内 部 不 一 致 和 某 些 情况 下 的 内 存 不 足 导 致 。 所 有 错误 消息 都 写 人 标准 错误 
流 ; 执行 命令 的 普通 输出 宇和 人 标准 输出 。 


在 主 提示 符 或 从 提示 符 后 输入 中 断 符 (通常 为 Control-C 或 DEL) 可 以 取消 输入 ， 并 返回 到 主 提示 
符 。[2] 命 令 执 行 过 程 中 输入 中 断 符 将 引发 Keyboardlnterrupt 异 常 ， 它 可 以 被 try 语 名 截获 。 


2.2.2. 可 执行 的 Python 脚本 


在 类 BSD BY Unix 系统 上 ， 可 以 将 Python 脚本 变 成 可 直接 执行 的 ， 就 像 shell 脚本 一 样 。 通 
过 放置 一 行 


#! /usr/bin/env python3.4 


(假定 解释 器 在 用 户 的 PATH 中 ) 在 脚本 的 开始 并 且 给 文件 可 执行 的 模式 。#! 必 须 是 文件 的 前 
两 个 字符 。 在 一 些 平台 上 ， 这 第 一 行 必须 以 一 个 Unix 风格 的 行 结束 符 (\n') ， 而 不 是 
Windows 的 行 结束 符 (\r\n') 结尾 。 注 意 ， 字 符 可， 是 Python 注释 的 起 始 符号 。 


可 以 通过 chmod 命令 给 予 脚 本 可 执行 的 模式 或 权限 : 


$ chmod +x myscript.py 


在 Windows 系统 上 ， 没 有 "可 执行 模式 "的 概念 。Python 安装 程序 会 自动 将 .py 文件 与 
python.exe 关联 ， 双 击 Python 文件 将 以 脚本 的 方式 运行 它 。 扩 展 名 也 可 以 是 .pyw， 在 这 种 
情况 下 ， 通 常 出 现 的 控制 台 窗 口 不 会 在 显示 了 。 


2.2.3. 源 程序 的 编码 


Python 源 文 件 默认 以 UTF-8 编 码 。 在 这 种 编码 下 ， 世 界 上 大 多 数 语言 的 字符 可 以 在 字符 串 ， 
标识 符 和 注释 中 同时 使 用 一 尽管 标准 库 中 的 标识 符 只 使 用 ASCII 字 符 ， 它 是 可 移植 代码 应 该 
遵循 的 一 个 惯例 。 为 了 能 够 正确 显示 所 有 的 这 些 字符 ， 你 的 编辑 器 必须 能 够 识别 文件 是 UTF-8 
编码 ， 且 必须 使 用 支持 文件 中 所 有 字符 的 字体 。 

也 可 以 给 源 文 件 指定 一 个 不 同 的 编码 。 方 法 是 在 执行 的 后 面 再 增加 一 行 特殊 的 注释 来 定义 源 
文件 的 编码 : 


# -*- coding: encoding -*- 


通过 此 声明 ， 源 文件 中 的 所 有 字符 将 被 视 为 由 encoding 而 不 是 UTF-8 编 码 。 在 Python E 
考 手 册 的 codecs 小 节 中 ， 可 以 找到 所 有 可 能 的 编码 方式 列表 。 


例如 ， 如 果 你 选择 的 编辑 器 不 支持 UTF-8 编 码 的 文件 ， 而 只 能 用 其 它 编码 比如 Windows- 
1252， 你 可 以 这 样 写 : 


# -*- coding: cp-1252 -*- 


currency = u"€" 
print ord(currency) 


并 且 源 文件 中 的 所 有 字符 仍然 使 用 Windows-1252 字 符 集 。 这 个 特殊 的 编码 注释 必须 位 于 文件 
的 第 一 或 者 第 二 行 。 


2.2.4. 交互 式 启 动 文件 


当 您 以 交互 方式 使 用 Python 时 ， 让 解释 器 在 每 次 启动 时 执行 一 些 标准 命令 会 变 得 非常 方便 。 
你 可 以 通过 设置 环境 变量 PYTHONSTARTUP 为 包含 你 的 启动 命令 的 文件 的 名 字 。 这 类 似 于 
Unix shell 的 .profile 功 能 。 


这 个 文件 只 会 在 交互 式 会 话 时 读 取 ， 当 Python 从 脚本 中 读 取 命令 时 不 会 读 取 ， 当 /dev/tty 在 
命令 中 明确 指明 时 也 不 会 读 取 (尽管 这 种 方式 很 像 是 交互 方式 ) 。 它 和 交互 式 命令 在 相同 的 
命名 空间 中 执行 ， 所 以 在 交互 式 会 话 中 ， 由 它 定义 或 引用 的 一 切 可 以 在 解释 器 中 不 受 限制 地 
使 用 。 您 还 可 以 在 此 文件 中 更 改 sys.ps1 和 sys.ps2 的 提示 符 。 


如 果 您 想 要 从 当前 目录 读 取 额外 的 启动 文件 ， 你 可 以 在 全 局 启动 文件 中 使 用 这 样 的 代码 
ifos.path.isfile('.pythonrc.py'):exec(open('.pythonrc.py').read()), 3I5R R48 SE TERNI rh [8 FH E 
动 文件 ， 必 须要 在 脚本 中 明确 地 写 出 : 


import os 

filename = os.environ.get('PYTHONSTARTUP') 

if filename and os.path.isfile(filename): 
exec(open( filename) .read() ) 


2.2.5. 目 定 义 模块 


Python 提供 了 两 个 钧 子 (方法 ) 来 本 地 化 : sitecustomize 和 usercustomize。 若 要 查看 它 是 
如 何 工 作 ， 你 首先 需要 找到 你 的 site-packages 的 目录 。 Ba Python 并 运行 下 面 的 代码 : 


>>> import site 
>>> site.getusersitepackages() 
'/home/user/.local/lib/python3.4/site-packages' 


现在 你 可 以 在 此 目录 下 创建 名 为 usercustomize.py 的 文件 ， 并 把 任何 你 想 要 的 东西 放 在 里 面 。 
它 会 影响 每 个 Python 调用 ， 除 非 启 动 时 用 -s 选 项 来 禁用 自动 导入 。 


sitecustomize 的 工作 方式 相同 ， 但 通常 由 计算 机 的 管理 员 在 全 局 site-packages 目录 中 创建 ， 
并 在 usercustomize 之 前 导入 。 更 多 详细 信息 请 参阅 site 模块 的 文档 。 


脚注 
On Unix, the Python 3.x interpreter is by default not installed with the 


[1] executable named python, so that it does not conflict with a simultaneously 
installed Python 2.x executable. 


| [2] | A problem with the GNU Readline package may prevent this. | |-----|-----| 


3. Python 简介 


以 下 的 示例 中 ， 输 入 和 输出 通过 有 没有 以 提示 符 (>>> 和 ...) 来 区 分 : 如 果 要 重复 该 示例 ， 你 
必须 在 提示 符 出 现 后 ， 输 入 提示 符 后 面 的 所 有 内 容 ; 没有 以 提示 符 开头 的 行 是 解释 器 的 输 
出 。 注 意 示例 中 出 现 从 提示 符 意味 着 你 一 定 要 在 最 后 加 上 一 个 空 行 ; 这 用 于 结束 一 个 多 行 命 


A 
To 


本 手册 中 的 很 多 示例 ， 甚 至 在 交互 方式 下 输入 的 示例 ， 都 带 有 注释 。Python 中 的 注释 以 “ 井 
EU, 4, 开始 ， 直 至 实际 的 行 尾 。 注 释 可 以 从 行 首 开始 ， 也 可 以 跟 在 空白 或 代码 之 后 ， 但 不 
能 包含 在 字符 串 字面 量 中 。 字 符 串 字面 量 中 的 # 字 符 仅仅 表示 #。 因 为 注释 只 是 为 了 解释 代码 
并 且 不 会 被 Python 解 释 器 解释 ， 所 以 敲 入 示例 的 时 候 可 以 忽略 它们 。 


例如 : 


# this is the first comment 
spam = 1 # and this is the second comment 
# ... and now a third! 
text = "# This is not a comment because it's inside quotes." 


3.1. 将 Python 当做 计算 器 


让 我 们 党 试 一 些 简 单 的 Python 命令 。 和 启 动 解释 器 然后 等 待 主 提示 符 >>>。 (应 该 不 需要 很 
久 。) 


3.1.1. 数字 


解释 器 可 作为 一 个 简单 的 计算 器 : 你 可 以 向 它 输入 一 个 表达 式 ， 它 将 返回 其 结果 。 表 达 式 语 
AREA: 运算 符 +、 -、* 和 /的 用 法 就 和 其 它 大 部 分 语言 一 样 (例如 Pascal 或 C) ; 括号 (()) 
可 以 用 来 分 组 。 例 如 : 


>>> (50 - 5*6) / 4 

5.0 

>>> 8 / 5 # division always returns a floating point number 
1.6 


整数 (例如 2, 4, 20) 的 类 型 是 int， 带 有 小 数 部 分 数字 (e.g. 5.0, 1.6) 的 类 型 是 float。 在 本 教程 的 
后 面 我 们 会 看 到 更 多 关于 数字 类 型 的 内 容 。 


除法 (/) 永 远 返回 一 个 浮 点 数 。 如 要 使 用 fjoor 除法 并 且 得 到 整数 结果 (丢掉 任何 小 数 部 分 ) ， 


你 可 以 使 用 /运算 符 ; 要 计算 余数 你 可 以 使 用 % : 


>>> 17 / 3 # classic division returns a float 
5.666666666666667 
>>> 


>>> 17 // 3 # floor division discards the fractional part 


5 


>>> 17 % 3 # the % operator returns the remainder of the division 


2 
>>> 5 * 3-2 # result * divisor + remainder 
17 


iit Python, ic LARA 2 SERERHT FRIES] : 


>>> 5 ** 2 # 5 squared 

25 

>>> 2 ** 7 #2 to the power of 7 
128 


等 号 (=) 用 于 给 变量 赋值 。 赋 值 之 后 ， 在 下 一 个 提示 符 之 前 不 会 有 任何 结果 显示 : 


>>> width = 20 
>>> height = 5*9 
>>> width * height 
900 





如 果 变 量 没有 "定义 ”( 赋 值 ) ， 使 用 的 时 候 将 会 报错 : 


>>> n # try to access an undefined variable 
Traceback (most recent call last): 

File "«stdin»", line 1, in «module» 
NameError: name 'n' is not defined 


浮 点 数 完 全 支持 ; 整数 和 浮 点 数 的 混合 计算 中 ， 整 数 会 被 转换 为 浮 点 数 : 


> =>/ abo 
7:5 

>>> 7.0/2 

3.5 


在 交互 模式 下 ， 最 近 一 次 表达 式 的 值 被 赋 给 变量 _。 
的 时 候 ， 可 以 方便 的 进行 连续 计算 ， 例 如 : 


这 意味 着 把 Python 当做 桌面 计算 器 使 用 


>>> tax = 12.5 / 100 
>>> price = 100.50 
>>> price * tax 
12.5625 

>>> price + _ 
113.0625 

>>> round(_, 2) 
113.06 


用 户 应 该 将 这 个 变量 视 为 只 读 的 。 不 要 试图 去 给 它 赋值 一 一 你 将 会 创建 出 一 个 独立 的 同名 局 
Hra, HERRAT AEX EARR. 

除了 int 和 float，Python 还 支持 其 它 数 字 类 型 ， 例 如 小 数 and 分 数 。Python 还 内 建 支持 复 

数 ， 使 用 后 级 j KI 表示 虚数 部 分 〈 例 如 3+5j) 。 


3.1.2. 字符 串 


除了 数值 ，Python 还 可 以 操作 字符 串 ， 可 以 用 几 种 方法 来 表示 。 它 们 可 以 用 单 引 号 (.…) 或 双 
引号 ("…") 揪 起 来 ， 效 果 是 一 样 的 [2]。\ 可 以 用 来 转 义 引号 。 


>>> "Spam eggs' # single quotes 


"spam eggs' 

>>> 'doesn\'t' # use \' to escape the single quote... 
"doesn't" 

>>> "doesn't" # ...or use double quotes instead 
"doesn't" 


>>> '"Yes," he said.' 
"ves," he said.' 

>>> "\"Yes,\" he said." 
'"Yes," he said." 

>>> '"Isn\'t," she said.' 
'""IsnN't," she said. ' 


在 交互 式 解释 器 中 ， 输 出 的 字符 串 会 用 引号 引起 来 ， 特 殊 字 符 会 用 反 斜 杠 转 义 。 虽然 可 能 和 
输入 看 上 去 不 太一 样 ， 但 是 两 个 字符 串 是 相等 的 。 如 果 字 符 串 中 只 有 单 引 号 而 没有 双 引 号 ， 

就 用 双 引 号 引用 ， 否 则 用 单 引 号 引用 。print() 本 数 生成 可 读 性 更 好 的 输出 , 它 会 省 去 引号 并 且 
打印 出 转 义 后 的 特殊 字符 : 


>>> '"Isn\'t," she said.' 

'""IsnN't," she said.' 

>>> print('"Isn\'t," she said.') 

"Isn't," she said. 

>>> s = 'First line.\nSecond line.' # \n means newline 
>>> s # without print(), \n is included in the output 
"First line.\nSecond line. ' 

>>> print(s) # with print(), \n produces a new line 
First line. 

Second line. 


如 果 你 前 面 带 有 \ 的 字符 被 当 作 特殊 字符 ， 你 可 以 使 用 原始 字符 串 ， 方 法 是 在 第 一 个 引号 前 面 
加 上 一 个 r: 


>>> print('C:NsomeNname') # here \n means newline! 
C:Nsome 

ame 

>>> print(r'C:NsomeNname') # note the r before the quote 
C: NsomeNname 


字符 串 可 以 跨 多 行 。 一 种 方法 是 使 用 三 引号 : ""…"" 或 者 ".…"。 行 尾 换行 符 会 被 自动 包含 到 字 
符 串 中 ， 但 是 可 以 在 行 尾 加 上 、\ 来 避免 这 个 行为 。 下 面 的 示例 : 


print("""N 

Usage: thingy [OPTIONS] 
-h Display this usage message 
-H hostname Hostname to connect to 


wit ") 


将 生成 以 下 输出 (注意 ， 没 有 开始 的 第 一 行 ) 


Usage: thingy [OPTIONS] 
-h Display this usage message 
-H hostname Hostname to connect to 


字符 串 可 以 用 + 操作 符 联接 ， 也 可 以 用 * 操作 符 重复 多 次 : 


>>> # 3 times 'un', followed by 'ium' 
>>> 8 * 'un' + 'ium' 


'unununium' 


相 令 的 两 个 或 多 个 字符 串 字面 量 〈 用 引号 引起 来 的 ) 会 自动 连接 。 


>>> 'Py' 'thon' 
'Python' 


>>> prefix = 'Py' 


>>> prefix 'thon' # can't concatenate a variable and a string literal 


SyntaxError: invalid syntax 


>>> ('un' * 3) 'ium' 


SyntaxError: invalid syntax 


如 果 你 想 连 接 多 个 变量 或 者 连接 一 个 变量 和 一 个 常量 ， 使 用 + : 


>>> prefix + 'thon' 
'Python' 


这 个 功能 在 你 想 输 入 很 长 的 字符 串 的 时 候 特别 有 用 : 


>>> text = ('Put several strings within parentheses ' 
"to have them joined together.') 
>>> text 


"Put several strings within parentheses to have them joined together.' 


字符 串 可 以 索引 ， 第 一 个 字符 的 索引 值 为 0。Python 没有 单独 的 字符 类 型 ; 字符 就 是 长 度 为 1 
的 字符 串 。 


>>> word = 'Python' 

>>> word[0] # character in position 0 
'p! 

>>> word[5] # character in position 5 
!n! 


索引 也 可 以 是 负 值 ， 此 时 从 右 侧 开始 计数 : 


>>> word[-1] # last character 

!n' 

>>> word[-2] # second-last character 
‘oO! 

>>> word[-6] 

'p! 


注意 ， 因 为 -0 和 0 是 一 样 的 ， 负 的 索引 从 -1 开始 。 


除了 索引 ， 还 支持 切片 。 索 引用 于 获得 单个 字符 ， 切 片 让 你 获得 子 字符 串 : 


>>> word[0:2] # characters from position 0 (included) to 2 (excluded) 
"Py! 
>>> word[2:5] # characters from position 2 (included) to 5 (excluded) 
"tho' 


注意 ， 包 含 起 始 的 字符 ， 不 包含 末尾 的 字符 。 这 使 得 s[:i]+s[i:] 永远 等 于 s : 


>>> word[:2] + word[2:] 
'Python' 
>>> word[:4] + word[4:] 
'Python' 


切片 的 索引 有 非常 有 用 的 默认 值 ; 省 略 的 第 一 个 素 引 默认 为 需 ， 省 略 的 第 二 个 索引 默认 为 切 
片 的 字符 串 的 大 小 。 


>>> word[:2] # character from the beginning to position 2 (excluded) 
'py! 

>>> word[4:] # characters from position 4 (included) to the end 

‘on! 

>>> word[-2:] # characters from the second-last (included) to the end 
"ont 


有 个 方法 可 以 记 住 切片 的 工作 方式 ， 把 索引 当做 字符 之 间 的 点 ， 第 一 个 字符 的 左边 是 0。 含 有 
n 个 字符 的 字符 串 的 最 后 一 个 字符 的 右边 是 索引 n, BUD : 


第 一 行 给 出 了 字符 串 中 0..5 各 索引 的 位 置 ; 第 二 行 给 出 了 相应 的 负 素 引 。 从 i 到 j 的 切片 由 ji 
和 j 之 间 的 所 有 字符 组 成 。 


对 于 非 负 素 引 ， 如 果 上 下 都 在 边界 内 ， 切 片 长 度 就 是 两 个 索引 之 差 。 例 如 ，word[1:3] 的 长 度 
是 2。 


试图 使 用 太 大 的 索引 会 导致 错误 : 


>>> word[42] # the word only has 7 characters 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
IndexError: string index out of range 


但 是 ， 当 用 于 切片 时 ， 超 出 范围 的 切片 索引 会 优雅 地 处 理 : 


>>> word[4:42] 
'on' 
>>> word[42:] 


Python 字符 串 不 可 以 改变 一 它们 是 不 可 变 的 。 因 此 ， 赋 值 给 字符 串 索 引 的 位 置 会 导致 错误 : 


>>> word[0] = 'J' 


TypeError: 'str' object does not support item assignment 
>>> word[2:] = 'py' 


TypeError: 'str' object does not support item assignment 


如 果 你 需要 一 个 不 同 的 字符 串 ， 你 应 该 创建 一 个 新 的 : 


>>> 'J' + word[1:] 
"Jython' 

>>> word[:2] + 'py' 
'Pypy ' 


AEKn ROFE : 


>>> s = 'supercalifragilisticexpialidocious' 
>>> len(s) 
34 

请 参阅 


Text Sequence Type 一 strStrings are examples of sequence types, and support the 
common operations supported by such types.Síring MethodsStrings support a large number 
of methods for basic transformations and searching. String FormattinglInformation about 
string formatting with str.format() is described here.printf-style String FormattingThe old 
formatting operations invoked when strings and Unicode strings are the left operand of the 
% operator are described in more detail here. 


3.1.3. 列表 


Python 有 几 个 复合 数据 类 型 ， 用 来 组 合 其 他 的 值 。 最 有 用 的 是 列表 ， 可 以 写成 中 括号 中 的 
一 列 用 去 号 分 隔 的 值 。 列 表 可 以 包含 不 同类 型 的 元 素 ， 但 是 通常 所 有 的 元 素 都 具有 相同 的 类 
型 。 


>>> squares = [1, 4, 9, 16, 25] 
>>> squares 
aby thy Gy alls 2) 


和 字符 串 (以 及 其 它 所 有 内 建 的 序列 类 型 ) 一 样 ， 列 表 可 以 索引 和 切片 : 


>>> squares[0] # indexing returns the item 

1 

>>> squares[-1] 

25 

>>> squares[-3:] # slicing returns a new list 
[9, 16, 25] 


所 有 的 切片 操作 都 会 返回 一 个 包含 请 求 的 元 素 的 新 列表 。 这 意味 着 下 面 的 切片 操作 返回 列表 
一 个 新 的 〈 浅 ) ae 


>>> squares[:] 
[1, 4, 9, 16, 25] 


列表 也 支持 连接 这 样 的 操作 : 


>>> squares + [36, 49, 64, 81, 100] 
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100] 


SATENFHRKA, JRE ZÉ 类 型 ， 例 如 可 以 改变 它们 的 内 容 : 


>>> cubes = [1, 8, 27, 65, 125] # something's wrong here 
>>> 4 ** 3 # the cube of 4 is 64, not 65! 

64 

>>> cubes[3] = 64 # replace the wrong value 

>>> cubes 

[1, 8, 27, 64, 125] 


你 还 可 以 使 用 append() 方 法 〈 后 面 我 们 会 看 到 更 多 关于 方法 的 内 容 ) 在 列表 的 末尾 添加 新 的 
元 素 : 


>>> cubes.append(216) # add the cube of 6 
>>> cubes.append(7 ** 3) # and the cube of 7 
>>> cubes 

[1, 8, 27, 64, 125, 216, 343] 


给 切片 赋值 也 是 可 以 的 ， 此 操作 其 至 可 以 改变 列表 的 大 小 或 者 清空 


>>> letters = ka be OA ee Yo] 
>>> letters 

[nas puc desee stie ug 

>>> # replace some values 

>>> lettersi2: 5) =) cU {Dw YEU 

>>> letters 

eu. Vion Meh, FD, MEUS Oy Su] 

>>> # now remove them 

>>> letters[2:5] = [] 

>>> letters 

[UEM] 

>>> # clear the list by replacing all the elements with an empty list 
>>> letters[:] = [] 

>>> letters 


[] 


ABW AMlen ()th3s AFI : 


>>> letters [aU bu teu, tq 
>>> len(letters) 
4 


WRAARE (创建 包含 其 他 列表 的 列表 ) ， 例 如 : 


>>> a= ['a', 'b', 'c'] 

>>> n= [1, 2, 3] 

>>> x = [a, n] 

>>> X 

[['a', 'b', 'c'], [1, 2, 3]] 
>>> x[0] 


[Gea Uae, Kean] 
>>> x[0][1] 
“pe 


3.2. 编程 第 一 步 


当然 ， 我 们 可 以 将 Python 用 于 比 2 加 2 更 复 末 的 任务 。 例 如 ， 我 们 可 以 写 一 个 生成 辈 波 那 契 
初始 子 序列 的 程序 ， 如 下 所 示 : 


>>> # Fibonacci series: 
. # the sum of two elements defines the next 
. a, b=90, 1 
>>> while b < 10: 
print(b) 
a, b = b, a+b 


ouomwn FF : 


本 示例 介绍 了 几 种 新 功能 。 


。 第 一 行 包括 了 一 个 多 重 赋值 : 变量 a 和 b 同 时 获得 新 的 值 0 和 1。 最 后 一 行 又 这 样 使 用 了 
一 次 ， 说 明 等 号 右边 的 表达 式 在 赋值 之 前 首先 被 完全 解析 。 右 侧 表 达 式 是 从 左 到 右 计 算 
的 。 


e 只 要 条 件 (这 里 是 b<10) 为 true，[while](#) 循 环 反复 执行 。 在 =" Python=" 中 ， 和 ="" 
C=" 一 样 ， 任 何 非 需 整 数值 都 为 =" true ; A=" false。 人 循环 条 件 也 可 以 是 一 个 字符 串 
或 者 列表 ， 实 际 上 可 以 是 任何 序列 ; 长 度 不 为 需 的 序列 为 =" true， 空 序列 为 ="" false. 
示例 中 使 用 的 测试 是 一 个 简单 的 比较 。 标 准 比 较 运 算 符 与 =" 的 写法 一 样 : < (小 于 ) ， 
-"» (大 于 ) ，= = (等 于 )，< = (小 于 或 等 于 ) ， > = (大 于 或 等 于 ) 和 ! = (不 等 
于 ) 。 


。 循环 体 是 缩 进 的 : 缩 进 是 Python 分 组 语句 的 方式 。 交 互 式 输入 时 ， 你 必须 为 每 个 缩 进 
的 行 输入 一 个 tab 或 (ST) 空格 。 实 践 中 你 会 用 文本 编辑 器 来 编写 复杂 的 Python E 
序 ; 所 有 说 得 过 去 的 文本 编辑 器 都 有 自动 缩 进 的 功能 。 交 互 式 输入 复合 语句 时 ， 最 后 必 
须 在 跟随 一 个 空 行 来 表示 结束 (因为 解析 器 无 法 猜测 你 什么 时 候 已 经 输入 最 后 一 行 ) 。 
注意 基本 块 内 的 每 一 行 必须 按 相 同 的 量 缩 进 。 


。 print() 汞 数 输出 传 给 它 的 参数 的 值 。 与 仅仅 输出 你 想 输 出 的 表达 式 不 同 (就 像 我 们 在 前 面 
计算 器 的 例子 中 所 做 的 ) ， 它 可 以 输出 多 个 参数 、 浮 点 数 和 字符 串 。 打 印 出 来 的 字符 串 
不 包含 引号 ， 项 目 之 间 会 插入 一 个 空格 ， 所 以 你 可 以 设置 漂亮 的 格式 ， 像 这 样 : 


>>> i = 256*256 
>>> print('The value of i is', i) 
The value of i is 65536 


关键 字 参 数 end 可 以 避免 在 输出 后 面 的 空 行 ， 或 者 可 以 指定 输出 后 面 带 有 一 个 不 同 的 字符 
E: 


>>> a, b= 0, 1 

>>> while b < 1000: 
print(b, end=',') 
a, b = b, a+b 


1,1,2,3,5,8,13,21,34, 55, 89, 144, 233, 377,610, 987, 


Footnotes 


[1] Since has higher precedence than -, -32 will be interpreted as -(32) and thus 
result in -9. To avoid this and get 9, you can use (-3)2. 


| [2] | Unlike other languages, special characters such as \n have the same meaning with 
both single ('...') and double ("...") quotes. The only difference between the two is that within 
single quotes you don't need to escape " (but you have to escape V) and vice versa. | |-----|-- 


4. 控制 流 


除了 前 面 介绍 的 while 语 句 ，Python 也 有 其 它 语言 常见 的 流程 控制 语句 ， 但 是 稍 有 不 同 。 


4.1. if 语句 
也 许 最 知名 的 语句 类 型 是 if 语句 。 例 如 : 


>>> x = int(input("Please enter an integer: ")) 
Please enter an integer: 42 
>>> if x < 0: 
x = 0 
print('Negative changed to zero') 
. elif x == 0: 
print('Zero') 
. elif x == 1: 
print('Single' ) 
. else: 
print('More') 


More 


BJEUBSEA XAR elif PB, else 部 分 是 可 选 的 。 关 键 字 'el 是 'else if 的 简写 ， 可 以 有 效 避 
免 过 深 的 缩 进 。if...elif ...elif ... 序列 用 于 替代 其 它 语 言 中 switch 或 case 语句 。 


4.2. for 语句 


Python 中 的 for 语 句 和 你 可 能 熟悉 的 C sk Pascal 中 的 有 点 不 同 。 和 常见 的 依据 一 个 等 差 数 列 
迭代 Gl Pascal) ， 或 让 用 户 能 够 自 定义 迭代 步骤 和 停止 条 件 (B C) 不 一 样 ，Python 的 
for 语句 按照 元 素 出 现 的 顺序 迭代 任何 序列 (列表 或 字符 串 ) 。 例 如 (没有 双关 意 ) 


>>> # Measure some strings: 
. words = ['cat', 'window', 'defenestrate' ] 
>>> for w in words: 
print(w, len(w)) 
cat 3 
window 6 
defenestrate 12 


如 果 要 在 循环 内 修改 正在 迭代 的 序列 〈 例 如 ， 复 制 所 选 的 项 目 ) ， 建 议 首先 制作 副本 。 人 迭代 
序列 不 会 隐 式 地 创建 副本 。 使 用 切片 就 可 以 很 容易 地 做 到 : 


>>> for w in words[:]: # Loop over a slice copy of the entire list. 
if len(w) > 6: 
words.insert(0, w) 


>>> words 


['defenestrate', 'cat', 'window', 'defenestrate'] 


4.3. range() HX 
AL SER Se Fe ERE ANAFI, AB EREXrange((R73 18. CREMSERII : 


>>> for i in range(5): 
print(i) 


Bh WN EF OO: 


给 定 的 终点 永远 不 会 在 生成 的 序列 中 ; 若 要 依据 索引 迭代 序列 ， 你 可 以 结合 使 用 range() 和 
len() ， 如 下 所 示 : 也 可 以 让 range 画 数 从 另 一 个 数值 开始 ， 或 者 可 以 指定 一 个 不 同 的 步 进 值 
(甚至 是 负数 ， 有 时 这 也 被 称 为 ' 步 长 7) 


range(5, 10) 
5 through 9 


range(0, 10, 3) 
0, 3, 6, 9 


range(-10, -100, -30) 
-10, -40, -70 


若 要 依据 索引 迭代 序列 ， 你 可 以 结合 使 用 range () 和 len() ， 如 下 所 示 : 


>>> a = ['Mary', 'had', 'a', 'little', 'lamb'] 
>>> for i in range(len(a)): 
print(i, a[i]) 
0 Mary 
1 had 
2a 


3 little 
4 lamb 


SAM, TEAR, ABB oat ee MA enumerate) Haam E, iF Looping 
Techniques. 


如 果 你 只 打印 range， 会 出 现 奇 怪 的 结果 : 


>>> print(range(10)) 
range(0, 10) 


range() 返 回 的 对 象 的 行为 在 很 多 方面 很 像 一 个 列表 ， 但 实际 上 它 并 不 是 列表 。 当 你 迭代 它 的 
时 候 它 会 依次 返回 期 望 序列 的 元 素 ， 但 是 它 不 会 真正 产生 一 个 列表 ， 因 此 可 以 节省 空间 。 


我 们 把 这 样 的 对 象 称 为 可 迭代 的 ， 也 就 是 说 它们 适合 期 望 连续 获得 元 素 的 函数 和 构造 器 ,直到 
穷尽 。 我 们 已 经 看 到 for 语 句 是 这 样 的 一 个 迭代 器 。list() 函 数 是 另外 一 个 ; 它 从 可 迭代 对 象 创 
建 列表 。 


>>> list(range(5)) 
[0, T, 27 3, 4] 


后 面 我 们 会 看 到 更 多 返回 可 迭代 对 象 和 以 可 迭代 对 象 作为 参数 的 西数 。 


4.4. break 和 continue 语句 ， 以 及 循环 中 else 字句 
Break 语句 和 C 中 的 类 似 ， 用 于 跳出 最 近 的 for 或 while 循环 。 


循环 语句 可 以 有 一 个 else FA ; 当 (for) 循环 迭代 完整 个 列表 或 (while) 循环 条 件 变 为 
false， 而 非 由 break 语句 终止 时 ， 它 会 执行 。 下 面 循环 搜索 质数 的 代码 例 示 了 这 一 点 : 


>>> for n in range(2, 10): 
for x in range(2, n): 
if n % x == 0: 
print(n, 'equals', x, '*', n//x) 
break 
else: 
# loop fell through without finding a factor 
print(n, 'is a prime number') 


is a prime number 
is a prime number 
equals 2 * 2 
is a prime number 
equals 2 * 3 
is a prime number 
equals 2 * 4 


Oo AN DOA 5 QO M - 


equals 3 * 3 


(是 的 ， 这 是 正确 的 代码 。 看 仔细 : else 子 句 属于 for 循环 ， 不 属于 if 语句 。) 


当 使 用 一 个 循环 ， else 子 句 已 更 像 的 else 子 句 的 try 语 句 而 不 是 ，if 语 句 : try 语 句 的 else 子 句 时 
未 发 生 任何 异常 ， 和 一 个 循环 else 子 句 运 行 不 会 中 断 发 生 时 运行 。 


更 多 关于 try 语 句 和 异常 的 内 容 ， 请 参见 处 理 异常 。 continue 语句 ， 也 是 从 C 语言 借 来 的 ， 表 
示 继 续 下 一 次 迭代 : 


>>> for num in range(2, 10): 
if num % 2 == 
print("Found an even number", num) 
continue 
print("Found a number", num) 
Found an even number 2 
Found a number 3 
Found an even number 4 
Found a number 5 
Found an even number 6 
Found a number 7 
Found an even number 8 
Found a number 9 


5. 数据 结构 


本 章 详 细 讲 述 你 已 经 学 过 的 一 些 知识 ， 并 增加 一 些 新 内 容 。 


5.1. 深入 列表 

列表 数据 类 型 还 有 更 多 的 方法 。 这 里 是 列表 对 象 的 所 有 方法 : 

list.append(x) 添加 一 个 元 素 到 列表 的 末尾 。 相 当 于 allen(a):]=[x]。 

list.extend(L) 将 给 定 列表 中 的 所 有 元 素 附 加 到 另 一 个 列表 的 末尾 。 相 当 于 allen(a):]=L。 


list.insert(/, x) 在 给 定位 置 插入 一 个 元 素 。 第 一 个 参数 是 准备 插入 到 其 前 面 的 那个 元 素 的 素 
引 ， 所 以 a.insert(0,x) 在 列表 的 最 前 面 插入 ，a.insert(len(a),x) 相当 于 a.append(x)。 


list.remove(x) 删除 列表 中 第 一 个 值 为 x 的 元 素 。 如 果 没 有 这 样 的 元 素 将 会 报错 。 


list.pop([/]) 删除 列表 中 给 定位 置 的 元 素 并 返回 它 。 如 果 未 指定 索引 ，a.pop() 删除 并 返回 列表 
中 的 最 后 一 个 元 素 。 (i 两 边 的 方 括号 表示 这 个 参数 是 可 选 的 ， 而 不 是 要 你 输入 方 括号 。 你 会 
在 Python 参考 库 中 经 常 看 到 这 种 表示 法 )。 


list.clear() 删除 列表 中 所 有 的 元 素 。 相 当 于 dela[:]。 

list.index(x) 返回 列表 中 第 一 个 值 为 x 的 元 素 的 索引 。 如 果 没 有 这 样 的 元 素 将 会 报错 。 
list.count(x) 返回 列表 中 x 出 现 的 次 数 。 

list.sort(cmp-None, key=None, reverse-False) 原 地 排序 列表 中 的 元 素 。 
list.reverse() 原 地 反 转 列表 中 的 元 素 。 

list.copy() 返回 列表 的 一 个 浅 拷 贝 。 等 同 于 a[:]。 

使 用 了 列表 大 多 数 方法 的 例子 : 


>>> a = [66.25, 333, 333, 1, 1234.5] 

>>> print(a.count(333), a.count(66.25), a.count('x')) 
210 

>>> a.insert(2, -1) 

>>> a.append(333) 

>>> a 

[66.25, 333, -1, 333, 1, 1234.5, 333] 

>>> a.index(333) 


>>> a.remove(333) 

>>> a 

[66.25, -1, 333, 1, 1234.5, 333] 
>>> a.reverse() 

>>> a 

[333, 1234.5, 1, 333, -1, 66.25] 
>>> a.sort() 

>>> a 

[-1, 1, 66.25, 333, 333, 1234.5] 
>>> a.pop() 

1234.5 

>>> a 

[-1, 1, 66.25, 333, 333] 


你 可 能 已 经 注意 到 像 insert, remove 或 者 sort 之 类 的 方法 只 修改 列表 而 没有 返回 值 打印 出 来 -- 
它们 其 实 返回 了 默认 值 None。[1 这 是 Python 中 所 有 可 变数 据 结构 的 设计 原则 。 


5.1.1. 将 列表 作为 堆栈 使 用 


列表 方法 使 得 将 列表 当 作 堆栈 非常 容易 ， 最 先进 入 的 元 素 最 后 一 个 取出 〈 后 进 先 出 ) 。 使 用 
append() 将 元 素 添 加 到 堆栈 的 顶部 。 使 用 不 带 索 引 的 pop) 从 堆栈 的 顶部 取出 元 素 。 例 如 : 


>>> stack = [3，4，5] 
>>> stack.append(6) 
>>> stack.append(7) 
>>> stack 

[3, 4, 5, 6, 7] 

>>> stack. pop() 


>>> stack 
[3, 4, 5, 6] 
>>> stack.pop() 


>>> stack.pop() 


>>> stack 
[3, 4] 


5.1.2. 将 列表 当 作 队列 使 用 


也 可 以 将 列表 当 作 队列 使 用 ， 此 时 最 先进 入 的 元 素 第 一 个 取出 (先进 先 出 ) ; 但 是 列表 用 作 
此 目的 效率 不 高 。 在 列表 的 末尾 添加 和 弹出 元 素 非常 快 ， 但 是 在 列表 的 开头 插入 或 弹出 元 素 
却 很 慢 (因为 所 有 的 其 他 元 素 必须 向 后 移 一 位 )。 


如 果 要 实现 一 个 队列 ， 可 以 使 用 collections.deque， 它 设计 的 目的 就 是 在 两 端 都 能 够 快速 添 
加 和 弹出 元 素 。 例 如 : 


>>> from collections import deque 


>>> queue = deque(["Eric", "John", "Michael"]) 

>>> queue.append("Terry") # Terry arrives 

>>> queue.append("Graham" ) # Graham arrives 

>>> queue.popleft() # The first to arrive now leaves 
HEUS 

>>> queue.popleft() 4 The second to arrive now leaves 

' John' 

>>> queue # Remaining queue in order of arrival 


deque(['Michael', 'Terry', 'Graham']) 


5.1.3. 列表 解析 


列表 解析 提供 了 一 个 生成 列表 的 简洁 方法 。 应 用 程序 通常 会 从 一 个 序列 的 每 个 元 素 的 操作 结 
果 生成 新 的 列表 ， 或 者 生成 满足 特定 条 件 的 元 素 的 子 序列 。 


例如 ， 假 设 我 们 想 要 创建 一 个 列表 squares : 


>>> squares = [] 

>>> for x in range(10): 
squares.append(x**2) 

>>> squares 


[0, 1, 4, 9, 16, 25, 36, 49, 64, 81] 


我 们 可 以 用 下 面 的 方式 得 到 同样 的 结果 : 


squares = [x**2 for x in range(10)] 


这 也 相当 于 squares=list(map(lambdax:x**2,range(10)))， 但 是 更 简洁 和 易 读 。 


列表 解析 由 括号 括 起 来 ， 括 号 里 面包 含 一 个 表达 式 ， 表 达 式 后 面 跟 着 一 个 for 语 句 ， 后 面 还 可 
以 接 需 个 或 更 多 的 for 或 if 语句 。 结 果 是 一 个 新 的 列表 ， 由 表达 式 依据 其 后 面 的 for 和 if 字句 
上 下 文 计 算 而 来 的 结果 构成 。 例 如 ， 下 面 的 listcomp 组 合 两 个 列表 中 不 相等 的 元 素 : 


>>> [(x, y) for x in [1,2,3] for y in [3,1,4] if x != y] 
[(1, 3), (1, 4), (2, 3), (27 357 (2, 4), (3, 255 (3, 4)] 


它 等 效 于 : 


>>> combs = [] 
>>> for x in [1,2,3]: 
for y in [3,1,4]: 
if x != y: 
combs.append((x, y)) 


>>> combs 
[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4)] 


注意 在 两 个 代码 段 中 for 和 if 语句 的 顺序 是 相同 的 。 


如 果 表 达 式 是 一 个 元 组 〈 例 如 前 面 示例 中 的 (x，y)) ， 它 必须 带 圆 括号 。 


>>> vec = [-4, -2, 0, 2, 4] 
>>> # create a new list with the values doubled 
>>> [x*2 for x in vec] 
[-8, -4, 0, 4, 8] 
>>> # filter the list to exclude negative numbers 
>>> [x for x in vec if x >= 0] 
[0, 2, 4] 
>>> # apply a function to all the elements 
>>> [abs(x) for x in vec] 
[ay Py OC, 2 OI 
>>> # call a method on each element 
>>> freshfruit = [' banana', ' loganberry ', 'passion fruit '] 
>>> [weapon.strip() for weapon in freshfruit] 
['banana', 'loganberry', 'passion fruit'] 
>>> # create a list of 2-tuples like (number, square) 
>>> [(x, x**2) for x in range(6)] 
[(6, ©), (1, 1), (2, 4), (3, 9), (4, 16), (5, 25)] 
>>> # the tuple must be parenthesized, otherwise an error is raised 
>>> [x, x**2 for x in range(6)] 

File "«stdin»", line 1, in ? 

[x, x**2 for x in range(6)] 
^ 

SyntaxError: invalid syntax 
>>> # flatten a list using a listcomp with two 'for' 
>>> vec = [[1,2,3], [4,5,6], [7,8,9]] 
>>> [num for elem in vec for num in elem] 
[la 2, Sy “8, Sy Ga Wp Bp WI 


WARM TASS RAR IA ARERR : 


>>> from math import pi 
>>> [str(round(pi, i)) for i in range(1, 6)] 
[aod 301 35142 331416% 531411592] 


5.1.4. BRE AY FU Ze AR AT 


列表 解析 中 的 第 一 个 表达 式 可 以 是 任何 表达 式 ， 包 括 列表 解析 。 
考虑 下 面 由 三 个 长 度 为 4 的 列表 组 成 的 3x4 矩阵 : 


>>> matrix = [ 

fly 2r eh Me 
[5, 6, 7, 8], 
[9, 10, 11, 12], 


下 面 的 列表 解析 将 转 置 行 和 列 : 


>>> [[row[i] for row in matrix] for i in range(4)] 
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]] 


EARME- 3$: ERÉ, REN listeomp 在 跟随 它 之 后 的 for 字句 中 计算 ， 所 以 此 例 等 同 
T: 


>>> transposed = [] 
>>> for i in range(4): 
transposed.append([row[i] for row in matrix]) 


>>> transposed 
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]] 


以 此 下 去 ， 还 等 同 于 : 


>>> transposed = [] 
>>> for i in range(4): 
# the following 3 lines implement the nested listcomp 
transposed_row = [] 
for row in matrix: 
transposed row.append(row[i]) 
transposed.append(transposed row) 


>>> transposed 
Lt, Se Sly |e (Gy, 39e lise Wp Sab, ley ch, 221) 


在 实际 中 ， 和 与 复 玉 的 控制 流 比 起 来 ， 你 应 该 更 喜欢 内 置 的 函数 。 针 对 这 种 场景 ， 使 用 zip() E 
数 会 更 好 : 


>>> list(zip(*matrix)) 
[(1, 5, 9), (2, 6, 10), (3, 7, 11), (4, 8, 12)] 


关于 本 行 中 使 用 的 星 号 的 说 明 ， 请 参阅 参数 列表 的 分 拆 。 


5.2. del 语 句 


有 个 方法 可 以 从 列表 中 按 索引 而 不 是 值 来 删除 一 个 元 素 : del 语句 。 这 不 同 于 有 返回 值 的 
pop() 方法 。del 语句 还 可 以 用 于 从 列表 中 删除 切片 或 清除 整个 列表 (我 们 是 将 空 列表 赋值 给 
DA) 。 例 如 : 


>>> a = [-1, 1, 66.25, 333, 333, 1234.5] 
>>> del a[0] 

>>> a 

[1, 66.25, 333, 333, 1234.5] 

>>> del a[2:4] 

>>> a 

[1, 66.25, 1234.5] 

>>> del a[:] 

>>> a 


[] 


del 也 可 以 用 于 删除 整个 变量 : 


>>> del a 


此 后 再 引用 名 称 a 将 会 报错 《直到 有 另 一 个 值 被 赋 给 它 ) 。 稍 后 我 们 将 看 到 del 的 其 它 用 途 


o 


5.3. 元 组 和 序列 


我 们 已 经 看 到 列表 和 字符 串 具 有 很 多 共同 的 属性 ， 如 索引 和 切片 操作 。 它 们 是 序列 数据 类 型 
的 两 个 例子 (参见 Sequence Types — list, tuple, range)。 因 为 Python 是 一 个 正在 不 断 进化 的 
语言 ， 其 他 的 序列 类 型 也 可 能 被 添加 进来 。 还 有 另 一 种 标准 序列 数据 类 型 : 元 组 。 


元 组 由 逗号 分 割 的 若干 值 组 成 ， 例 如 : 


>>> t = 12345, 54321, 'hello!' 
>>> t[0] 

12345 

>>> t 

(12345, 54321, 'hello!') 

>>> # Tuples may be nested: 

,Met, Gi, 2 2 A Sy 
>>> u 
((12345, 54321, 'hello!'), (1, 2, 3, 4, 5)) 
>>> # Tuples are immutable: 

. t[0] = 88888 
Traceback (most recent call last): 

File "«stdin»", line 1, in «module» 
TypeError: 'tuple' object does not support item assignment 
>>> # but they can contain mutable objects: 

a VS (lll 2p Sle lls, 2, 2) 
>>> V 
(I1, 2, 3], [3, 2, 1]) 


DORA IL, FOAM REAR SH, LET EBARREAY ; 在 输入 时 括号 可 有 可 
无 ， 不 过 括号 经 常 都 是 必须 的 〈 如 果 元 组 是 一 个 更 大 的 表达 式 的 一 部 分 ) 。 不 能 给 元 组 中 单 
独 的 一 个 元 素 赋 值 ， 不 过 可 以 创建 包含 可 变 对 象 〈 例 如 列表 ) 的 元 组 。 


虽然 元 组 看 起 来 类 似 于 列表 ， 它 们 经 常用 于 不 同 的 场景 和 不 同 的 目的 。 元 组 是 不 可 变 的 ， 通 
常 包 含 不 同 种 类 的 元 素 并 通过 分 拆 (参阅 本 节 后 面 的 内 容 ) 或 索引 访问 (如 果 

是 namedtuples， 甚 至 可 以 通过 属性 ) 。 列 表 是 可 去 的 ， 它 们 的 元 素 通常 是 相同 类 型 的 并 通 
REIN He 

一 个 特殊 的 情况 是 构造 包含 0 个 或 1 个 元 素 的 元 组 : 为 了 实现 这 种 情况 ， 语 法 上 有 一 些 奇 
怪 。 空 元 组 由 一 对 空 括号 创建 ; 只 有 一 个 元 素 的 元 组 由 值 后 面 跟随 一 个 逗号 创建 (在 括号 中 放 
入 单独 一 个 值 还 不 够 ) o HE, BEA% BAN : 


>>> empty = () 

>>> singleton = 'hello', # <-- note trailing comma 
>>> len(empty) 

>>> len(singleton) 

>>> singleton 


('hello',) 


语句 t=12345,54321,'hello! 是 一 个 元 组 封装 的 例子 : (812345,54321 和 'hello! 被 一 起 放 入 一 
个 元 组 。 其 逆 操 作 也 是 可 以 的 : 


>>> X, y, Z=t 


这 被 称 为 序列 分 拆 再 恰当 不 过 了 ， 且 可 以 用 于 右边 的 任何 序列 。 序 列 分 拆 要 求 等 号 左 侧 的 变 
量 和 序列 中 的 元 素 的 数目 相同 。 注 意 多 重 赋值 只 是 同时 进行 元 组 封装 和 序列 分 拆 。 


5.4. 集合 


Python 还 包含 了 一 个 数据 类 型 集合 。 集 合 中 的 元 素 不 会 重复 且 没 有 上 顺序。 集合 的 基本 用 途 有 
成 员 测 试 和 消除 重复 的 条 目 。 集 合 对 象 还 支持 并 集 、 交集 、 差 和 对 称 差 等 数学 运算 。 


花 大 括号 或 set) 函数 可 以 用 于 创建 集合 。 注 意 : 若 要 创建 一 个 空 集 必 须 使 用 set()， 而 不 能 用 
0; 后 者 将 创建 一 个 空 的 字典 ， 一 个 我 们 在 下 一 节 中 讨论 数据 结构 。 


这 里 是 一 个 简短 的 演示 : 


>>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'} 

>>> print(basket) # show that duplicates have been removed 
{'orange', 'banana', 'pear', ‘apple'} 

>>> 'orange' in basket # fast membership testing 

True 

>>> 'crabgrass' in basket 

False 


>>> # Demonstrate set operations on unique letters from two words 


>>> a = set('abracadabra') 
>>> b = set('alacazam') 


>>> a # unique letters ina 
(gU, "pus. T[g?, Ug ge 
>>> a - b # letters in a but not in b 
pu. M. ie 
>>> a | b # letters in either a or b 
Ue et Ui Uo SUE Um era Uy 
>>> a&b # letters in both a and b 
UON ECL 
>>> a^ b # letters in a or b but not both 


Seite clue Ui 'm', dris UY 


和 列表 解析 RW, Python 也 支持 集合 解析 : 


>>> a = {x for x in 'abracadabra' if x not in "abc'} 
>>> a 


fup. 'd'i 


5.5. 字典 


Python 中 内 置 的 另 一 种 有 用 的 数据 类 型 是 字典 〈 见 映射 的 类型 一 一 字典 )。 有 时 候 你 会 发 现 

字典 在 其 它 语言 中 被 称 为 “associative memories” 或 者 “associative arrays", SHIA, Fe 
列 由 数字 做 索引 ， 字 典 由 键 做 索引 ， 键 可 以 是 任意 不 可 变 类 型 ; 字符 串 和 数字 永远 可 以 拿 来 
做 键 。 如 果 元 组 只 包含 字符 串 、 数字 或 元 组 ， 它 们 可 以 用 作 键 ; 如 果 元 组 直接 或 间接 地 包含 

任何 可 变 对 象 ， 不 能 用 作 键 。 不 能 用 列表 作为 键 ， 因 为 列表 可 以 用 索引 、 切 片 或 者 append() 

和 extend() 方法 修改 。 


理解 字典 的 最 佳 方式 是 把 它 看 做 无 序 的 键 : 值 对 集合 ， 要 求 是 键 必须 是 唯一 的 〈 在 同一 个 字典 
内 ) 。 一 对 大 括号 将 创建 一 个 空 的 字典 : 人 }。 大 括号 中 由 有 逗号 分 隔 的 键 : 值 对 将 成 为 字典 的 初 
始 值 ; 打印 字典 时 也 是 按照 这 种 方式 输出 。 


字典 的 主要 操作 是 依据 键 来 存 取 值 。 也 可 以 通过 del 删除 键 : 值 对 。 如 果 用 一 个 已 经 存在 的 
键 存 储 值 ， 以 前 为 该 关键 字 分 配 的 值 就 会 被 遗忘 。 用 一 个 不 存在 的 键 中 读 取 值 会 导致 错误 。 


list(d.keys()) 返 回 字典 中 所 有 键 组 成 的 列表 ， 列 表 的 顺序 是 随机 的 (如 果 你 想 它 是 有 序 的 ， 只 
需 使 用 sorted(d.keys()) 代 替 ) 。[2] 要 检查 某 个 键 是 否 在 字典 中 ， 可 以 使 用 in 关键 字 。 


下 面 是 一 个 使 用 字典 的 小 示例 : 


>>> tel = {'jack': 4098, 'sape': 4139} 

>>> tel['guido'] = 4127 

>>> tel 

{'sape': 4139, 'guido': 4127, 'jack': 4098} 
>>> tel['jack'] 

4098 

>>> del tel['sape'] 

>>> tel['irv'] = 4127 

>>> tel 

{'guido': 4127, 'irv': 4127, 'jack': 4098} 
>>> list(tel.keys()) 


['irv', 'guido', 'jack'] 
>>> sorted(tel.keys()) 
['guido', 'irv', 'jack'] 


>>> 'guido' in tel 
True 

>>> 'jack' not in tel 
False 


dict() 4438 ES 2ACIE fe M ib - 8 t Fe 7 6] EET BR : 


>>> dict([('sape', 4139), ('guido', 4127), ('jack', 4098)]) 
{'sape': 4139, 'jack': 4098, 'guido': 4127} 


此 外 ， 字 典 解析 可 以 用 于 从 任意 键 和 值 表达 式 创 建 字典 : 


>>> (x: x**2 for x in (2, 4, 6)} 
(2: 4, 4: 16, 6: 36) 


如 果 键 都 是 简单 的 字符 串 ， 有 时 通过 关键 字 参 数 指定 键 - 值 对 更 为 方便 : 


>>> dict(sape=4139, guido=4127, jack=4098) 
{'sape': 4139, 'jack': 4098, 'guido': 4127} 


5.6. 通 历 的 技巧 
循环 迭代 字典 的 时 候 ， 键 和 对 应 的 值 通过 使 用 items() 方 法 可 以 同时 得 到 。 


>>> knights = {'gallahad': 'the pure', 'robin': 'the brave'} 
>>> for k, v in knights.items(): 
print(k, v) 


gallahad the pure 
robin the brave 


序列 中 通 历 时 ， 使 用 enumerate() KA MAE ay 45: 30588 Al xt 7 B) 48 o 


>>> for i, v in enumerate(['tic', 'tac', 'toe']): 
print(i, v) 

9 tic 

1 tac 

2 toe 


[E] E388 75 SS AYA, EA zip() ERAT AR xt iE ERITH. 


>>> questions = ['name', 'quest', 'favorite color'] 
>>> answers = ['lancelot', 'the holy grail', 'blue'] 
>>> for q, a in zip(questions, answers): 
print('What is your {0}? It is {1}.'.format(q, a)) 


What is your name? It is lancelot. 


What is your quest? It is the holy grail. 
What is your favorite color? It is blue. 


ERA 75 — DEI, BAIERARK TS, ZAI reversed() KHZ 


>>> for i in reversed(range(1, 10, 2)): 
print(i) 


HB c Oc) o - 


(a4 —T Fe 2UTRBEREAREE, AE MAsorted H, RE T ATA BRU, et RRA 


>>> basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana' ] 
>>> for f in sorted(set(basket)): 
print(f) 
apple 
banana 
orange 
pear 


St a FA SMECUE Hae HAAS 〈 例 如 复制 某 些 元 素 ) ， 建 议 您 首先 制作 副本 。 在 序列 
上 循环 不 会 隐 式 地 创建 副本 。 切 片 表示 法 使 这 尤其 方便 : 


>>> words = ['cat', 'window', 'defenestrate'] 
>>> for w in words[:]: # Loop over a slice copy of the entire list. 
if len(w) > 6: 
words.insert(0, w) 


ee words 
['defenestrate', 'cat', 'window', 'defenestrate'] 
7. 深入 条 件 控制 
while 和 if 语句 中 使 用 的 条 件 可 以 包含 任意 的 操作 ， 而 不 仅仅 是 比较 。 


比较 操作 符 in 和 notin 检查 一 个 值 是 否 在 一 个 序列 中 出 现 ( 不 出 现 ) 。is 和 isnot 比较 两 个 对 
象 是 否 为 同一 对 象 ; 这 5 aes 样 的 可 变 对 象 有 有关 。 所 有 上 比较 运算 符 都 具有 相同 的 优先 
级 ， 低 于 所 有 数值 运算 符 。 


可 以 级 联 比 较 。 例 如 ， a<b= =c 测试 a 是 否 小 于 b 并 且 b 等 于 c。 


可 将 布尔 运算 符 and 和 or 用 于 比较， 上 比较 的 结果 (或 任何 其 他 的 布尔 表达 式 ) 可 以 用 not EX 
反 。 这 些 操作 符 的 优先 级 又 低 于 比较 操作 符 ; 它们 之 间 ，not 优先 级 最 高 ，or 优先 级 最 低 ， 所 
以 Aand notBorC 等 效 于 (Aand(notB))orC。 与 往常 一 样 ， 可 以 使 用 括号 来 表示 所 需 的 组 合 。 


布尔 运算 符 and 和 or 是 所 谓 的 短路 运算 符 : 依 参 数 从 左 向 右 求 值 ， 结 果 一 旦 确定 就 停止 。 
例如 ， 如 果 A 和 C 都 为 真 ， 但 B 是 假 ， AandBandC 将 不 计算 表达 式 C。 用 作 一 个 普通 值 而 非 
逻辑 值 时 ， 短 路 操作 符 的 返回 值 通常 是 最 后 一 个 计算 的 。 


可 以 把 比较 或 其 它 逻辑 表达 式 的 返回 值 赋 给 一 个 变量 。 例 如 ， 


>>> string1, string2, string3 = '', 'Trondheim', 'Hammer Dance' 
>>> non null = stringi or string2 or string3 
>>> non_null 


'Trondheim' 


注意 Python $C 不 同 ， 在 表达 式 内 部 不 能 赋值 。C 程序 员 可 能 会 抱怨 这 一 点 ， 但 它 避 免 了 
一 类 C 程序 中 常见 的 问题 : 在 表达 式 中 输入 = 而 真正 的 意图 是 == 。 


5.8. 序列 和 其 它 类 型 的 比较 


序列 对 象 可 以 与 具有 相同 序列 类 型 的 其 他 对 象 相 比 较 。 上 比较 按照 字典 序 进行 : 首先 比较 最 前 
面 的 两 个 元 素 ， 如 果 不 同 ， 就 决定 了 比较 的 结果 ; 如 果 相 同 ， 就 比较 后 面 两 个 元 素 ， 依 此 类 
推 ， 直 到 其 中 一 个 序列 穷 举 完 。 如 果 要 比较 的 两 个 元 素 本 身 就 是 同一 类 型 的 序列 ， 就 按 字 典 
序 递 上 比较 。 如 果 两 个 序列 的 所 有 元 素 都 相等 ， 就 为 序 认 列 相等 。 如 果 一 个 序列 是 另 一 个 序 
列 的 初始 子 序列 ， 较 短 的 序列 就 小 于 另 一 个 。 字 符 串 的 排序 按照 Unicode 编 码 点 的 数值 排序 单 
个 字符 。 下 面 是 同类 型 序列 之 间 上 比较 的 一 些 例子 : 


(ap 2 3) < (1, 2, 4) 

[abe 2p Sl < [1, 2, 4] 

"ABC' < 'C' < 'Pascal' < 'Python' 

(2 3, 1) (1525272045) 

(1, 2) « (1, 2, -1) 
C23) == (1.0, 2.0, 3.0) 


(1, 2, ('aa', 'ab')) < (1, 2, ('abc', 'a'), 4) 


注意 ， 使 用 < 或 者 > 比较 不 同类 型 的 对 象 是 合法 的 ， 只 要 这 些 对 象 具 有 合适 的 比较 方法 。 例 
如 ， 不 同 的 数字 类 型 按照 它们 的 数值 比较 ， 所 以 0 等 于 0.0， 等 等 。 否 则 ， 解 释 器 将 引发 一 
个 TypeError 异 常 ， 而 不 是 随便 给 一 个 顺序 。 


脚注 


Other languages may return the mutated object, which allows method 
chaining, such as d->insert("a")->remove("b")->sort();. 


[1] 
| [2] | Calling d.keys() will return a dictionary view object. It supports operations like 
membership test and iteration, but its contents are not independent of the original dictionary 
— it is only a view. | |-----|-----| 


6. 模块 


如 果 你 退出 Python 解释 器 并 重新 进入 ， 你 做 的 任何 定义 (变量 和 方法 ) 都 会 丢失 。 因 此 ， 如 
果 你 想 要 编写 一 些 更 大 的 程序 ， 最 好 使 用 文本 编辑 器 先 编写 好 ， 然 后 运行 这 个 文件 。 这 就 是 
所 谓 的 创建 脚本 。 随 着 你 的 程序 变 得 越 来 越 长 ， 你 可 能 想 要 将 它 分 成 几 个 文件 ， 这 样 更 易于 
维护 。 你 还 可 能 想 在 几 个 程序 中 使 用 你 已 经 编写 好 的 函数 ， 而 不 用 把 酌 数 丘 贝 到 每 个 程序 
中 。 


为 了 支持 这 个 功能 ，Python 有 种 方法 可 以 把 你 定义 的 内 容 放 到 一 个 文件 中 ， 然 后 在 脚本 或 者 
交互 方式 中 使 用 。 这 种 文件 称 为 模块 ; 模块 中 的 定义 可 以 导入 到 其 它 模块 或 主 模块 中 。 


模块 是 包含 Python 定义 和 声明 的 文件 。 文 件 名 就 是 模块 名 加 上 .py 后 级 。 在 模块 里 面 ， 模 块 
的 名 字 (是 一 个 字符 串 ) 可 以 由 全 局 变量 name 的 值得 到 。 例 如 ， 用 你 喜欢 的 文本 编辑 器 在 
当前 目录 下 创建 一 个 名 为 fibo.py 的 文件 ， 内 容 如 下 : 


# Fibonacci numbers module 


def fib(n): # write Fibonacci series up to n 
a, b-0,41 
while b « n: 
print(b, end=' ') 
a, b = b, a+b 
print() 


def fib2(n): # return Fibonacci series up to n 
result - [] 
a, b-0,41 
while b « n: 
result.append(b) 
a, b = b, a+b 
return result 


现在 进入 Python 解释 器 并 使 用 下 面 的 命令 导 和 这 个 模块 : 


>>> Import fibo 


这 不 会 直接 把 fibo 中 定义 的 函数 的 名 字 导 入 当前 的 符号 表 中 ; 它 只 会 把 模块 名 字 fibo 导入 其 
中 。 你 可 以 通过 模块 名 访问 这 些 画 数 : 


>>> fibo.fib(1000) 

11235 8 13 21 34 55 89 144 233 377 610 987 
>>> fibo.fib2(100) 

[i 2, 2) 3) 5, 8, 13) 21 34) 55 89] 

>>> fibo. name . 

' fibo' 


如 果 你 打算 频繁 使 用 一 个 范 数 ， 可 以 将 它 赋 给 一 个 本 地 的 变量 : 


>>> fib = fibo.fib 
>>> fib(500) 
11235 8 13 21 34 55 89 144 233 377 


6.1. 深入 模块 


模块 可 以 包含 可 执行 语句 以 及 男 数 的 定义 。 这 些 语句 通常 用 于 初始 化 模块 。 它 们 只 在 第 一 次 
导入 时 执行 。[1] (如 果 文 件 以 脚本 的 方式 执行 ， 它 们 也 会 运行 。) 


每 个 模块 都 有 自己 的 私有 符号 表 ， 模 块 内 定义 的 所 有 画 数 用 其 作为 全 局 符号 表 。 因 此 ， 模 块 
的 作者 可 以 在 模块 里 使 用 全 局 变量 ， 而 不 用 担心 与 某 个 用 户 的 全 局 变量 有 冲突 。 另 一 方面 ， 
如 果 你 知道 自己 在 做 什么 ， 你 可 以 使 用 引用 模块 画 数 的 表示 法 访问 模块 的 全 局 变量 ， 


modname.itemname。 


模块 中 可 以 导入 其 它 模块 。 习 惯 上 将 所 有 的 import 语句 放 在 模块 (或 者 脚本 ) 的 开始 ， 但 这 
不 是 强制 性 的 。 被 导入 的 模块 的 名 字 放 在 导入 模块 的 全 局 符号 表 中 。 


import 语句 的 一 个 变 体 直接 从 被 导入 的 模块 中 导入 名 字 到 模块 的 符号 表 中 。 例 如 : 


>>> from fibo import fib, fib2 
>>> fib(500) 
1125358 13 21 34 55 89 144 233 377 


这 不 会 把 模块 名 导 和 人 到 本 地 的 符号 表 中 〈 所 以 在 本 例 中 ，fibo 将 没有 定义 ) 。 
还 有 种 方式 可 以 导入 模块 中 定义 的 所 有 名 字 : 


>>> from fibo import * 
>>> fib(500) 
1125358 13 21 34 55 89 144 233 377 


这 种 方式 不 会 导入 以 下 划 线 (_) 开头 的 名 称 。 大 多 数 情 况 下 Python 程序 员 不 会 使 用 这 个 便利 的 
方法 ， 因 为 它 会 引入 一 系列 未 知 的 名 称 到 解释 器 中 ， 这 很 可 能 隐藏 你 已 经 定义 的 一 些 东 西 。 


EX — lif RRERAM—MERROSA*, AARBRSSRN GR Ke, dE 
交互 式 会 话 中 这 样 用 是 可 以 的 ， 它 可 以 让 你 少 敲 一 些 代码 。 

注意 

出 于 性 能 考虑 ， 每 个 模块 在 每 个 解释 器 会 话 中 只 导入 一 通 。 因 此 ， 如 果 你 修改 了 你 的 模块 ， 


你 必需 重新 启动 解释 器 或 者 ， 如 果 你 就 是 想 交 互 式 的 测试 这 么 一 个 模块 ， 可 以 使 
用 imp.reload(), 例如 importimp;imp.reload(modulename)。 





6.1.1. 执行 模块 
当 你 用 下 面 的 方式 运行 一 个 Python 模块 


python fibo.py <arguments> 


模块 中 的 代码 将 会 被 执行 ， 就 像 导入 它 一 样 ， 不 过 此 时 name 被 设置 为 "main" 。 也 就 是 说 ， 
如 果 你 在 模块 后 加 入 如 下 代码 : 


if name == " main 





import sys 
fib(int(sys.argv[1])) 


就 可 以 让 此 文件 既 可 以 作为 可 执行 的 脚本 ， 也 可 以 当 作 可 以 导入 的 模块 ， 因 为 解析 命令 行 的 
那 部 分 代码 只 有 在 模块 作为 “main" 文件 执行 时 才 被 调用 : 


$ python fibo.py 50 
1.12 3-5 8 13° 21 34 


如 果 模 块 是 被 导入 的 ， 将 不 会 运行 这 段 代 码 : 


>>> import fibo 
>>> 


这 种 方法 通常 用 来 为 模块 提供 一 个 方便 的 用 户 接 口 ， 或 者 用 来 测试 (例如 直接 运行 脚本 会 执 
行 一 组 测试 用 例 ) 。 


6.1.2. 模块 搜索 路 径 


当 导 入 一 个 名 为 spam 的 模块 时 ， 解 释 器 首先 搜索 具有 该 名 称 的 内 置 模块 。 如 果 没 有 找到 ， 
它 会 接着 到 sys.path 变量 给 出 的 目录 中 查找 名 为 spam.py 的 文件 。sys.path 变量 的 初始 值 来 
自 这 些 位 置 : 


e 脚本 所 在 的 目录 (如 果 没 有 指明 文件 ， 则 为 当前 目录 ) 。 
e PYTHONPATH (一 个 包含 目录 名 的 列表 ， 与 shell 变量 PATH 的 语法 相同 ) 。 
e. 与 安装 相关 的 默认 值 。 


Note 


在 支持 符号 连接 的 文件 系统 中 ， 输 入 的 脚本 所 在 的 目录 是 符号 连接 指向 的 目录 。 换 句 话说 也 
就 是 包含 符号 链接 的 目录 不 会 被 加 到 目录 搜索 路 径 中 。 


初始 化 后 ，Python 程序 可 以 修改 sys.path。 脚 本 所 在 的 目录 被 放置 在 搜索 路 径 的 最 开始 ， 也 
就 是 在 标准 库 的 路 径 之 前 。 这 意味 着 将 会 加 载 当 前 目录 中 的 脚本 ， 库 目录 中 具有 相同 名 称 的 
模块 不 会 被 加 载 。 除 非 你 是 有 意 想 蔡 换 标准 库 ， 否 则 这 应 该 被 当成 是 一 个 错误 。 更 多 信息 请 
参阅 标准 模块 小 节 。 


6.1.3. "编译 过 的 " Python 文件 


为 了 加 快 加 载 模 块 的 速度 ，Python 会 在 pycache 目 录 下 以 module.version.pyc 名 字 缓 存 每 个 模 
块 编译 后 的 版 本 ， 这 里 的 版 本 编制 了 编译 后 文件 的 格式 。 它 通常 会 包含 Python 的 版 本 号 。 例 
如 ， 在 CPython 3.3 版 中 ，spam.py 编译 后 的 版 本 将 缓存 为 pycache/spam.cpython-33.pyc。 
这 种 命名 约定 允许 由 不 同 发 布 和 不 同 版 本 的 Python 编译 的 模块 同时 存在 。 


Python 会 检查 源 文 件 与 编译 版 的 修改 日 期 以 确定 它 是 否 过 期 并 需要 重新 编译 。 这 是 完全 自动 
化 的 过 程 。 同 时 ， 编 译 后 的 模块 是 跨 平 台 的 ， 所 以 同一 个 库 可 以 在 不 同 架构 的 系统 之 间 共 


Fo 


Python 不 检查 在 两 个 不 同 环境 中 的 缓存 。 首 先 ， 它 会 永远 重新 编译 而 且 不 会 存储 直接 从 命令 
行 加 载 的 模块 。 其 次 ， 如 果 没有 源 模 块 它 不 会 检查 缓存 。 若 要 支持 没有 源 文件 (只 有 编译 
版 ) 的 发 布 ， 编 译 后 的 模块 必须 在 源 目录 下 ， 并 且 必 须 没 有 源 文件 的 模块 。 


部 分 高 级 技巧 : 

- {{s.58}}{{s.59}}{{s.60}}{{s.6 1 }}{{s.62}} 
- {{s.63}}{{s.64}}{{s.65}} 

- {{s.66}}{{s.67}} 

- {{s.68}}{{s.69}}{{s. 70} 

- (s.7 1 (R01) 

- {0} s.73 


6.2. 标准 模块 


Python 带 有 一 个 标准 模块 库 ， 并 发 布 有 单独 的 文档 叫 Python 库 参 考 手 册 (以 下 简称 " 库 参 考 
手册 ") 。 有 些 模 块 被 直接 构建 在 解析 器 里 ; 这 些 操作 虽然 不 是 语言 核心 的 部 分 ， 但 是 依然 被 
内 建 进来 ， 一 方面 是 效率 的 原因 ， 另 一 方面 是 为 了 提供 访问 操作 系统 原 语 如 系统 调用 的 功 
能 。 这 些 模块 是 可 配置 的 ， 也 取决 于 底层 的 平台 。 例 如 ，winreg 模块 只 在 Windows 系统 上 提 
供 。 有 一 个 特别 的 模块 需要 注意 : sys， 它 内 置 在 每 一 个 Python 解析 器 中 。 变 量 sys.ps1 和 
Sys.ps2 定义 了 主 提示 符 和 辅助 提示 符 使 用 的 字符 串 : 


>>> import sys 
>>> Sys.psi 
Jp V 


>>> sys.ps2 


>>> sys.psi = 'C> ' 


C» print('Yuck!') 
Yuck! 
c> 


只 有 在 交互 式 模 式 中 ， 这 两 个 变量 二 有 定义 。 


变量 sys.path 是 一 个 字符 串 列表 ， 它 决定 了 解释 器 搜索 模块 的 路 径 。 它 初始 的 默认 路 径 来 自 
于 环境 变量 PYTHONPATH， 如 果 PYTHONPATH 未 设置 则 来 自 于 内 置 的 默认 值 。 你 可 以 使 
用 标准 的 列表 操作 修改 它 : 


>>> import sys 
>>> sys.path.append( '/ufs/guido/lib/python') 


6.3. dir) HŽ 


AEKA dir() 用 来 找 出 模块 中 定义 了 哪些 名 字 。 它 返回 一 个 排 好 序 的 字符 串 列表 : 


>>> import fibo, sys 

>>> dir(fibo) 

[' name ', 'fib', 'fib2'] 

>>> dir(sys) 

[' displayhook ', ' doc ', ' excepthook ', ' loader ', ' name ' 
' package ', ' stderr ', ' stdin ', ' stdout ', 





, 








' clear type cache', ' current frames', ' debugmallocstats', ' getframe', 
' home', ' mercurial', ' xoptions', 'abiflags', 'api version', 'argv', 
'base exec prefix', 'base prefix', 'builtin module names', 'byteorder', 
'call tracing', 'callstats', 'copyright', 'displayhook', 

'dont write bytecode', 'exc info', 'excepthook', 'exec prefix', 
'executable', 'exit', 'flags', 'float info', 'float repr style', 
'getcheckinterval', 'getdefaultencoding', 'getdlopenflags', 
'getfilesystemencoding', 'getobjects', 'getprofile', 'getrecursionlimit', 
'getrefcount', 'getsizeof', 'getswitchinterval', 'gettotalrefcount', 
'gettrace', 'hash info', 'hexversion', 'implementation', 'int info', 
'intern', 'maxsize', 'maxunicode', 'meta path', 'modules', 'path', 

'path hooks', 'path importer cache', 'platform', 'prefix', 'psi', 
'setcheckinterval', 'setdlopenflags', 'setprofile', 'setrecursionlimit', 
'setswitchinterval', 'settrace', 'stderr', 'stdin', 'stdout', 

'thread info', 'version', 'version info', 'warnoptions'] 


如 果 不 带 参数 ， dir() 列 出 当前 已 定义 的 名 称 : 


>>> a = [1, 2, 3, 4, 5] 
>>> import fibo 

>>> fib = fibo.fib 

>>> dir() 


[9 bua'Tesnse name vay, abi fabo syst] 





注意 它 列 出 了 所 有 类 型 的 名 称 : 变量 、 模块 、 WAS. 


dir() 不 会 列 出 内 置 的 函数 和 变量 的 名 称 。 如 果 你 想 列 出 这 些 内 容 ， 它 们 定义 在 标准 模块 
builtins 中 : 


>>> import builtins 

>>> dir(builtins) 

['ArithmeticError', 'AssertionError', 'AttributeError', 'BaseException', 
'BlockinglIOError', 'BrokenPipeError', 'BufferError', 'BytesWarning', 
'ChildProcessError', 'ConnectionAbortedError', 'ConnectionError', 
'ConnectionRefusedError', 'ConnectionResetError', 'Deprecationwarning', 
'EOFError', 'Ellipsis', 'EnvironmentError', 'Exception', 'False', 
'FileExistsError', 'FileNotFoundError', 'FloatingPointError', 
'FutureWwarning', 'GeneratorExit', 'IOError', 'ImportError', 
'ImportWarning', 'IndentationError', 'IndexError', 'InterruptedError', 
'IsADirectoryError', 'KeyError', 'KeyboardInterrupt', 'LookupError', 
'MemoryError', 'NameError', 'None', 'NotADirectoryError', 'NotImplemented', 
'NotImplementedError', 'OSError', 'OverflowError', 
'PendingDeprecationWarning', 'PermissionError', 'ProcessLookupError', 
'ReferenceError', 'ResourceWarning', 'RuntimeError', 'RuntimeWarning', 
'StopIteration', 'SyntaxError', 'SyntaxWarning', 'SystemError', 
'SystemExit', 'TabError', 'TimeoutError', 'True', 'TypeError', 
'UnboundLocalError', 'UnicodeDecodeError', 'UnicodeEncodeError', 
'UnicodeError', 'UnicodeTranslateError', 'UnicodeWarning', 'UserWarning', 





'ValueError', 'Warning', 'ZeroDivisionError', ' ', ' build class  ', 
' debug ', ' doc ', ' import ', ' name ', ' package ', 'abs', 





'all', 'any', 'ascii', 'bin', 'bool', 'bytearray', 'bytes', 'callable', 
'chr', 'classmethod', 'compile', 'complex', 'copyright', 'credits', 
'delattr', 'dict', 'dir', 'divmod', 'enumerate', 'eval', 'exec', 'exit', 
'filter', 'float', 'format', 'frozenset', 'getattr', 'globals', 'hasattr', 
'hash', 'help', 'hex', 'id', 'input', 'int', 'isinstance', 'issubclass', 
‘iter', 'len', 'license', 'list', 'locals', 'map', 'max', 'memoryview', 
'min', 'next', 'object', 'oct', 'open', 'ord', 'pow', 'print', 'property', 
'quit', 'range', 'repr', 'reversed', 'round', 'set', 'setattr', 'slice', 
'sorted', 'staticmethod', 'str', 'sum', 'super', 'tuple', 'type', 'vars', 
'zip'] 


6.4. a 


包 是 一 种 管理 Python 模块 命名 空间 的 方式 ， 采 用 "点 分 模块 名 称 "。 例 如 ， 模 块 名 A.B 表示 包 

A 中 一 个 名 为 B 的 子 模块 。 RRL a TR IBURST OEE RI 的 全 局 变量 名 
称 一 样 ， 点 分 模块 的 使 用 让 包含 多 个 模块 的 包 (例如 Numpy 和 Python Imaging Library) 的 
作者 也 不 用 担心 相互 之 间 的 模块 重 名 。 


假设 你 想 要 设计 一 系列 模块 (或 一 个 “ 包 ”) 来 统一 处 理 声 音 文件 和 声音 数据 。 现 存 很 多 种 不 同 
的 声音 文件 格式 (通常 由 它们 的 扩展 名 来 识别 ， 例 如 : .wav, .aiff, .au) ， 因 此 你 可 能 需要 创 
建 和 维护 不 断 增 长 的 模块 集合 来 支持 各 种 文件 格式 之 间 的 转换 。 你 可 能 还 想 针 对 音频 数据 做 
很 多 不 同 的 操作 (上 比如 混 音 ， 添 加 回声 ， 增 加 均衡 器 功能 ， 创 建 人 造 立 体 声 效果 ) ， 所 以 你 

还 需要 编写 一 组 永远 写 不 完 的 模块 来 处 理 这 些 操作 。 你 的 包 可 能 会 是 这 个 结构 (用 分 层 的 文 
件 系统 表示 ) 


sound/ Top-level package 

__init__.py Initialize the sound package 

formats/ Subpackage for file format conversions 
__init__.py 
wavread.py 
wavwrite.py 
aiffread.py 
aiffwrite.py 
auread.py 
auwrite.py 


effects/ Subpackage for sound effects 
. init .py 
echo.py 
surround.py 
reverse.py 
filters/ Subpackage for filters 
. init__.py 
equalizer.py 


vocoder.py 
karaoke.py 


导入 这 个 包 时 ，Python 搜索 sys.path 中 的 目录 以 寻找 这 个 包 的 子 目录 。 


为 了 让 Python 将 目录 当做 包 ， 目 录 下 必须 包含 init.py 文件 ; 这 样 做 是 为 了 防止 一 个 具有 常 
RAS (例如 string) 的 目录 无 意中人 隐藏 目录 搜索 路 径 中 正确 的 模块 。 最 简单 的 情况 
T, initpy 可 以 只 是 一 个 空 的 文件 ， 但 它 也 可 以 为 包 执 行 初始 化 代码 或 设置 all 变 量 (WAS 


介绍 ) 。 


用 户 可 以 从 包 中 导入 单独 的 模块 ， 例 如 : 


import sound.effects.echo 


这 样 就 加 载 了 子 模 块 sound.effects.echo。 它 必须 使 用 其 完整 名 称 来 引用 。 


sound.effects.echo.echofilter(input, output, delay=0.7, atten=4) 


导 人 子 模块 的 另 一 方法 是 : 


from sound.effects import echo 


这 同样 也 加 载 了 子 模块 echo， 但 使 它 可 以 不 用 包 前 级 访问 ， 因 此 它 可 以 按 如 下 方式 使 用 : 


echo.echofilter(input, output, delay=0.7, atten=4) 


i x — x db AEIBRE S ABISEBUESIIUX d 38: 


from sound.effects.echo import echofilter 


RINK T Fecho, (Aix FHA se Mechofilter() 可 以 直接 访问 : 


echofilter(input, output, delay=0.7, atten-4) 


注意 使 用 rompackageimportitem 时 ，item 可 以 是 包 的 子 模块 (或 子 包 ) ， 也 可 以 是 包 中 定义 
的 一 些 其 它 的 名 称 ， 上 比如 函数 、 类 或 者 变量 。import 语 句 首 先 测试 item 在 包 中 是 否 有 定义 ; 
如 果 没 有 ， 它 假定 它 是 一 个 模块 ， 并 党 试 加 载 它 。 如 果 未 能 找到 ， 则 引发 ImportError 异 常 。 


相反 ， 使 用 类 似 importitem.subitem.subsubitem 这 样 的 语法 时 ， 除 了 最 后 一 项 其 它 每 项 必须 
是 一 个 包 ; 最 后 一 项 可 以 是 一 个 模块 或 一 个 包 ， 但 不 能 是 在 前 一 个 项 目 中 定义 的 类 、 画 数 或 


t. 


6.4.1. 从 包 中 导 人 * 


那么 现在 如 果 用 户 写成 fomsound.effectsimport* 会 发 生 什 么 ?理想 情况 下 ， 他 应 该 是 希望 到 
文件 系统 中 寻找 包 里 面 有 哪些 子 模块 ， 并 把 它们 全 部 导入 进来 。 这 可 能 需要 很 长 时 间 ， 而 且 
导入 子 模块 可 能 会 产生 想不到 的 副作用 ， 这 些 作 用 本 应 该 只 有 当 子 模块 是 显 式 导 人 时 才 会 发 
生 。 


唯一 的 解决 办 法 是 包 的 作者 为 包 提供 显 式 的 索引 。import 语句 使 用 以 下 约定 : 如 果 包 中 的 
init.py 代码 定义 了 一 个 名 为 all 的 列表 ， 那 么 在 过 到 ffompackageimport 语 句 的 时 候 ， 应 该 把 
这 个 列表 中 的 所 有 模块 名 字 导 入 。 当 包 有 新 版 本 包 发 布 时 ， 就 需要 包 的 作者 更 新 这 个 列表 
f. 如果 包 的 作者 认为 不 可 以 用 import 方式 导入 它们 的 包 ， 也 可 以 决定 不 支持 它 。 例 如 ， 文 
件 sound/effects/init.py 可 以 包含 下 面 的 代码 : 


. all = ["echo", "surround", "reverse"] 


这 意味 着 fromsound.effectsimport* 将 导 和 sound 包 的 三 个 子 模块 。 


如 果 all 没有 定义 ，fromsound.effectsimport 语句 不 * 会 从 sound.effects 包 中 导入 所 有 的 子 
模块 到 当前 命名 空间 ; ERIRE sound.effects 包 已 经 被 导入 (可 能 会 运行 init.py 中 的 任何 初 
始 化 代码 ) ， 然 后 导入 包 中 定义 的 任何 名 称 。 这 包括 由 init.py 定义 的 任何 名 称 (以 及 它 显 式 
加 载 的 子 模块 ) 。 还 包括 这 个 包 中 已 经 由 前 面 的 import 语句 显 式 加 载 的 子 模块 。 请 考虑 此 代 
5. 


import sound.effects.echo 
import sound.effects.surround 
from sound.effects import * 


在 这 个 例子 中 ， 执 行 fom...import iat, echo 和 surround 模块 被 导入 到 当前 命名 空间 是 
因为 它们 在 sound.effects 中 有 定义 。 (定义 了 all 时 也 会 同样 工作 。) 


虽然 某 些 模块 的 设计 旨 在 出 口 仅 按照 特定 的 模式 ， 当 您 使 用 导入 的 名 字 ， 仍 是 不 好 练习 在 生 
产 代 码 中 。 虽然 某 些 模块 设计 成 使 用 import 时 只 导出 符合 特定 模式 的 名 称 ， 在 产品 代码 中 使 
用 这 种 写法 仍然 是 不 好 的 做 法 。 


记 住 ， 使 用 fromPackageimportspecific submodule 一 点 没 错 ! 事实 上 ， 这 是 推荐 的 写法 ， 
除非 导入 的 模块 需要 使 用 其 它 包 中 的 同名 子 模块 。 


6.4.2. 包 内 引用 


如 果 一 个 包 是 子 包 (比如 例子 中 的 sound €) ， 你 可 以 使 用 绝对 导入 来 引用 兄弟 包 的 子 模 
块 。 例 如 ， 如 果 模 块 sound.filters.vocoder 需要 使 用 sound.effects 包 中 的 echo 模块 ， 它 可 以 
使 用 fomsound.effectsimportecho。 


你 还 可 以 用 frommoduleimportname 形 式 的 import 语 句 进 行 相对 导入 。 这 些 导 入 使 用 前 导 的 点 
号 表示 相对 导入 的 是 从 当前 包 还 是 上 级 的 包 。 以 surround 模块 为 例 ， 你 可 以 使 用 : 


from . import echo 
from .. import formats 
from ..filters import equalizer 


注意 ， 相 对 导入 基于 当前 模块 的 名 称 。 因 为 主 模 块 的 名 字 总 是 "main" ，Python 应 用 程序 的 
主 模 块 必须 总 是 用 绝对 导入 。 


6.4.3. 包含 多 个 目录 的 包 


包 还 支持 一 个 特殊 的 属性 ，path。 该 变量 初始 化 一 个 包含 init.py 所 在 目录 的 列表 。 这 个 变量 
可 以 修改 ; 这 样 做 会 影响 未 来 包 中 包含 的 模块 和 子 包 的 搜索 。 


虽然 通常 不 需要 此 功能 ， 它 可 以 用 于 扩展 包 中 的 模块 的 集合 。 
脚注 
In fact function definitions are also ‘statements’ that are ‘executed’; the 


[1] execution of a module-level function definition enters the function name in 
the module’s global symbol table. 


7. 输入 和 输出 


展现 程序 的 输出 有 多 种 方法 ; 可 以 打印 成 人 类 可 读 的 形式 ， 也 可 以 写 入 到 文件 以 便 后 面 使 
用 。 本 章 将 讨论 其 中 的 几 种 方法 。 


7.1. 格式 化 输出 


到 目前 为 止 我 们 遇 到 过 两 种 输出 值 的 方法 : 表达 式 语 句 和 print() 函 数 。 (第 三 个 方式 是 使 用 文 
件 对 象 的 write() 方 法 ; 标准 输出 文件 可 以 引用 sys.stdout。 详 细 内 容 参见 库 参 考 手册 。 ) 


通常 你 会 希望 更 好 地 控制 输出 的 格式 而 不 是 简单 地 打印 用 空格 分 隔 的 值 。 有 两 种 方法 来 设置 
输出 格式 ; 第 一 种 方式 是 自己 做 所 有 的 字符 串 处 理 ; 使 用 字符 串 切 片 和 连接 操作 ， 你 可 以 创 
建 任何 你 能 想象 到 的 布局 。 字 符 串 类 型 有 一 些 方法 ， 用 于 执行 将 字符 串 填充 到 指定 列 宽度 的 
有 用 操作 ; 这 些 稍 后 将 讨论 。 第 二 种 方法 是 使 用 strformat() 方 法 。 


string 模 块 包含 一 个 Template 类 ， 提 供 另 外 一 种 向 字符 串 代 入 值得 方法 。 


当然 还 有 一 个 问题 : 如 何 将 值 转换 为 字符 串 ?幸运 的 是 ，Python 有 方法 将 任何 值 转换 为 字符 
串 : 将 它 传递 给 repr() 或 str() 函 数 。 


str() 函 数 的 用 意 在 于 返回 人 类 可 读 的 表现 形式 ， 而 repr() 的 用 意 在 于 生成 解释 器 可 读 的 表现 形 
X (如 果 没 有 等 价 的 语法 将 会 引发 SyntaxError 异 常 ) 。 对 于 对 人 类 并 没有 特别 的 表示 形式 的 
对 象 ，str() 和 repr() 将 返回 相同 的 值 。 许 多 值 ， 例 如 数字 或 者 列表 和 字典 这 样 的 结构 ， 使 用 这 
两 个 图 数 中 的 任意 一 个 都 具有 相同 的 表示 形式 。 字 符 串 ， 特 殊 一 些 ， 有 两 种 不 同 的 表示 形 
式 。 

一 些 例子 : 


>>> 


>>> 


s = 'Hello, world.' 
str(s) 


"dello, world.' 


>>> 


repr(s) 


"'Hello, world.'" 


>>> 


str(1/7) 


'0.14285714285714285' 


>>> 
>>> 
>>> 
>>> 
The 
>>> 


x = 10 * 8,25 
y - 200 * 200 


s = 'The value of x is ' + repr(x) + ', and y is ' + repr(y) + '... 


print(s) 
value of x is 32.5, and y is 40000... 
# The repr() of a string adds string quotes and backslashes: 


. hello = 'hello, world\n' 


>>> 


>>> 


hellos = repr(hello) 
print(hellos) 


"hello, world\n' 


>>> 


# The argument to repr() may be any Python object: 
repr((x, y, ('spam', 'eggs'))) 


"(32.5, 40000, ('spam', 'eggs'))" 


这 里 用 两 种 方法 输出 平方 和 立方 表 : 


>>> for x in range(1, 11): 
print(repr(x).rjust(2), repr(x*x).rjust(3), end=' ') 
# Note use of 'end' on previous line 
print (repr(x*x*x).rjust(4) ) 


ON 0o0 0 NM HG - 
二 
Oo 
Oo 
A 


9 81 729 
10 100 1000 


>>> for x in range(1, 11): 
print('{0:2d} {1:3d} {2:4d}'.format(x, x*x, x*x*x)) 


ON O01 ^» 0 MN FE: 
ES 
Oo 
Oo 
A 


9 81 729 
10 100 1000 


(注意 在 第 一 个 示例 中 ， 每 列 之 间 的 一 个 空格 由 print() 自 动 添加 : 它 总 会 在 它 的 参数 之 间 添 加 
空格 。 ) 


上 面 的 例子 演示 了 字符 串 对 象 的 strrjust() 方 法 ， 它 通过 在 左 侧 填充 空格 使 字符 串 在 给 定 宽度 的 
列 右 对 齐 。 类 似 的 方法 还 有 str.ljust() 和 str.center()。 这 些 方法 不 会 输出 任何 内 容 ， 它 们 只 返回 
新 的 字符 串 。 如 果 输 入 的 字符 串 太 长 ， 它 们 不 会 截断 字符 串 ， 而 是 保持 原样 返回 ; 这 会 使 列 
的 格式 变 得 混乱 ， 但 是 通常 好 于 另外 一 种 选择 ， 那 可 能 是 一 个 错误 的 值 。 (如 果 你 真 的 想 
截断 ， 可 以 加 上 一 个 切片 操作 ， 例 如 x.ljust(n)[:n]。) 


另外 一 种 方法 str.zfill()， 它 向 数值 字符 捉 左 侧 填 充 需 。 该 娘 数 可 以 正确 识别 正 负 号 : 


>>> '12'.zfill(5) 

'00012' 

>>> '-8.414'.zfill(7) 

' -003.14' 

»»» '8.14159265359'.zfill(5) 
'3.14159265359' 


strformat() 方 法 的 基本 用 法 如 下 所 示 : 


>>> print('We are the {} who say "{}!"'.format('knights', 'Ni')) 
We are the knights who say "Ni!" 


花 括 号 及 其 中 的 字符 〈 称 为 格式 字段 ) 将 被 蔡 换 为 传递 给 strformat() 方 法 的 对 象 。 可 以 用 括号 
中 的 数字 指定 传递 给 str.format() 方 法 的 对 象 的 位 置 。 


>>> print('{0} and {1}'.format('spam', 'eggs')) 
spam and eggs 
>>> print('{1} and {0}'.format('spam', 'eggs')) 
eggs and spam 


如 果 strformat() 方 法 使 用 关键 字 参 数 ， 那 么 将 通过 参数 名 引用 它们 的 值 。 


>>> print('This {food} is [adjectivej.'.format( 
food-'spam', adjective-'absolutely horrible')) 
This spam is absolutely horrible. 


位 置 参 数 和 关键 字 参 数 可 以 随意 组 合 : 


>>> print('The story of {0}, {1}, and {other}.'.format('Bill', 'Manfred', 
other='Georg')) 
The story of Bill, Manfred, and Georg. 


"a! (用 于 ascii()) , "s! (用 于 str()) 和 "Ir' (用 于 repr()) 可 以 用 来 格式 化 之 前 对 值 进行 转换 。 


>>> import math 

>>> print('The value of PI is approximately {}.'.format(math.pi) ) 
The value of PI is approximately 3.14159265359. 

>>> print('The value of PI is approximately {!r}.'.format(math.pi)) 
The value of PI is approximately 3.141592653589793. 


字段 名 后 允许 可 选 的 ' 和 格式 指 合 。 这 人 允许 更 好 地 控制 如 何 设置 值 的 格式 。 下 面 的 例子 将 Pi 
转 为 三 位 精度 。 


>>> import math 
>>> print('The value of PI is approximately {0:.3f}.'.format(math.pi)) 
The value of PI is approximately 3.142. 


"后面 紧 跟 一 个 整数 可 以 限定 该 字段 的 最 小 宽度 。 这 在 美化 表格 时 很 有 用 。 


>>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 7678} 
>>> for name, phone in table.items(): 


Jack 
Dcab 
Sjoerd 


如 果 你 有 一 


print('{0:10} ==> {1:10d}'.format(name, phone) ) 


==> 4098 
==> 7678 
==> 4127 


个 实在 是 很 长 的 格式 字符 串 但 又 不 想 分 开 写 ， 要 是 可 以 按照 名 字 而 不 是 位 置 引用 


变量 就 好 了 。 有 个 简单 的 方法 ， 可 以 传人 一 个 字典 ， 然 后 使 用 由 访问 。 


>>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678} 


>>> print('Jack: {@[Jack]:d}; Sjoerd: {O0[Sjoerd]:d}; 


'Dcab: {0[Dcab]:d}'.format(table) ) 


Jack: 4098; Sjoerd: 4127; Dcab: 8637678 


这 也 可 以 用 “* 标志 将 这 个 字典 以 关键 字 参数 的 方式 传人 。 


>>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678} 
>>> print('Jack: {Jack:d}; Sjoerd: {Sjoerd:d}; Dcab: {Dcab:d}'.format(**table) ) 
Jack: 4098; Sjoerd: 4127; Dcab: 8637678 
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关于 strformat() 完 整 的 描述 ， 请 参见 格式 字符 串 语法 。 


7.1.1. 


旧式 的 字符 串 格 陈 


ee 它 将 左边 类 似 sprintf()- 风 格 的 参数 应 用 到 右边 的 参数 ， 然 


后 返 


这 种 格式 化 操作 生成 的 字符 串 。 例 如 : 


>>> import math 
>>> print('The value of PI is approximately %5.3f.' % math.pi) 
The value of PI is approximately 3.142. 


££ printf-style String Formatting 一 节 ， 可 以 找到 更 多 的 信息 。 


7.2. 读 写 文件 


open()i& 


一 个 文件 对 象 ， 最 常见 的 用 法 带 有 两 个 参数 : open(filename,mode)。 


>>> f = open('workfile', 'w') 


第 一 个 参数 是 一 个 含有 文件 名 的 字符 串 。 第 二 个 参数 也 是 一 个 字符 串 ， 含 有 描述 如 何 使 用 该 
文件 的 几 个 字符 。mmoae 为 "时 表示 只 是 读 取 文 件 ; w 表示 只 是 宇和 文件 (已 经 存在 的 同名 文 
Rate) ; 'a 表 示 打 开 文 件 进 行 追加 ， 写 入 到 文件 中 的 任何 数据 将 自动 添加 到 末 

尾 。'r+' 表 示 打 开 文 件 进 行 读 取 和 写 入 。mode 参数 是 可 选 的 ， 黑 认为 'r。 


通常 ， 文 件 以 文本 打开 ， 这 意味 着 ， 你 从 文件 读 出 和 向 文件 写 入 的 字符 串 会 被 特定 的 编码 方 
式 (默认 是 UTF-8) 编码 。 模 式 后 面 的 'b' 以 二 进 制 模 式 打开 文件 : 数据 会 以 字 节 对 象 的 形式 读 
出 和 写 入 。 这 种 模式 应 该 用 于 所 有 不 包含 文本 的 文件 。 


在 文本 模式 下 ， 读 取 时 默认 会 将 平台 有 关 的 行 结束 符 (Unix 上 是 \n, Windows 上 是 \r\in) 转换 为 
\。 在 文本 模式 下 写 人 时 ， 黑 认 会 将 出 现 的 转换 成 平台 有 关 的 行 结束 符 。 这 种 暗地里 的 修改 
xt ASCII 文本 文件 没有 问题 ， 但 会 损坏 JPEG 或 EXE 这 样 的 二 进 制 文件 中 的 数据 。 使 用 二 进 制 
模式 读 写 此 类 文件 时 要 特别 小 心 。 


7.2.1. 文件 对 象 的 方法 
本 节 中 的 示例 将 假设 文件 对 象 f 已 经 创建 。 


要 读 取 文件 内 容 ， 可 以 调用 f.read(size) ， 该 方法 读 取 若 干 数 量 的 数据 并 以 字符 串 或 字 节 对 象 
REl size 是 可 选 的 数值 参数 。 当 size 被 省 略 或 者 为 负数 时 ， 将 会 读 取 并 返回 整个 文件 ; 如 
果 文 件 大 小 是 你 机 器 内 存 的 两 倍 时 ， 就 是 你 的 问题 了 。 和 否则， 至 多 读 取 和 返回 size 大 小 的 字 
节 数据 。 如 果 到 了 文件 末尾 ，fread() 会 返回 一 个 空 字符 串 (")。 


>>> f.read() 
'This is the entire file.\n' 
>>> f.read() 


freadline() 从 文件 读 取 一 行 数 据 ; 字符 串 结尾 会 带 有 一 个 换行 符 (n) ， 只 有 当 文 件 最 后 一 行 没 
有 以 换行 符 结 尾 时 才 会 省 略 。 这 样 返回 值 就 不 会 有 混淆 ， 如 果 freadline() 返 回 一 个 空 字 符 
串 ， 那 就 表示 已 经 达到 文件 的 末尾 ， 而 如 果 返 回 一 个 只 包含 一 个 换行 符 的 字符 串 \n'， 则 表示 


遇 到 一 个 空 行 。 


>>> f.readline() 

"This is the first line of the file.\n' 
>>> f.readline() 

"Second line of the file\n' 

>>> f.readline() 


你 可 以 循环 通 历 文件 对 象 来 读 取 文件 中 的 每 一 行 。 这 是 既 省 内 存 又 非常 快 的 简单 代码 : 


>>> for line in f: 
print(line, end='') 


This is the first line of the file. 
Second line of the file 


如 果 你 想 把 文件 中 的 所 有 行 读 到 一 个 列表 中 ， 你 也 可 以 使 用 list(f) 或 freadlines()。 
fwrite(string) 将 string 的 内 容 写 入 文件 中 并 返回 写 入 的 字 节 的 数目 。 


>>> f.write('This is a test\n') 
15 


如 果 想 写 人 字符 串 以 外 的 数据 ， 需 要 先 将 它 转换 为 一 个 字符 串 : 


>>> value = ('the answer', 42) 
>>> s = str(value) 

>>> f.write(s) 

18 


ftell() 返 回 一 个 给 出 文件 对 象 在 文件 中 当前 位 置 的 整数 ， 在 二 进 制 模式 下 表示 自 文件 开头 的 比 
特 数 ， 在 文本 模式 下 是 一 个 无 法 理解 的 数 。 


若 要 更 改 该 文件 对 象 的 位 置 ， 可 以 使 用 f.seek(offset,from_what)。 新 的 位 置 由 参考 点 加 上 
offse 计算 得 来 ， 参 考点 的 选择 则 来 自 于 from what 参数 。from_what 值 为 0 表示 以 文件 的 开 
始 为 参考 点 ，1 表示 以 当前 的 文件 位 置 为 参考 点 ，2 表示 以 文件 的 结尾 为 参考 点 。from_what 
可 以 省 略 ， 默 认 值 为 0， 表 示 以 文件 的 开始 作为 参考 点 。 


>>> f = open('workfile', 'r+') 

>>> f.write('0123456789abcdef') 

>>> f.seek(5) # Go to the 6th byte in the file 
>>> f.read(1) 


V 
V 
V E 
-h 


.seek(-3, 2) # Go to the 3rd byte before the end 
.read(1) 


V 
V 
22V. 
-h 


在 文本 文件 中 〈 没 有 以 b 模 式 打 开 ) ， 只 允许 从 文件 头 开 始 寻找 (有 个 例外 是 用 seek(0,2) 寻 找 
文件 的 最 末尾 处 ) 而 且 合 法 的 偏 移 值 只 能 是 f.tell() 返 回 的 值 或 者 是 需 。 其 它 任何 偏 移 值 都 会 产 
生 未 定义 的 行为 。 

使 用 完 一 个 文件 后 ， 调 用 f.close() 可 以 关闭 它 并 释放 其 占用 的 所 有 系统 资源 。 调 用 f.close() 
后 ， 再 尝试 使 用 该 文件 对 象 业 失败 。 


>>> f.close() 
>>> f.read() 
Traceback (most recent call last): 
File "<stdin>", line 1, in ? 
ValueError: I/O operation on closed file 


义理 文件 对 象 时 使 用 with 关键 字 是 很 好 的 做 法 。 这 样 做 的 好 义 在 于 文件 用 完 后 会 自动 关闭 ， 即 
使 过 程 中 发 生 异 常 也 没关系 。 它 还 比 编写 一 个 等 同 的 try-finally 语 句 要 短 很 多 : 


>>> with open('workfile', 'r') as f: 
: read_data = f.read() 

>>> f.closed 

True 


文件 对 象 还 有 一 些 不 太 常 用 的 方法 ， 例 如 isatty() 和 truncate() ; 有 关 文 件 对 象 的 完整 指南 ， 请 
参阅 Python 库 参 考 手 册 。 


7.2.2. 使 用 json 存 储 结构 化 数据 


从 文件 中 污 写 字符 串 很 容易 。 数 值 就 要 多 费 点 儿 周 折 ， 因 为 read () 方 法 只 会 返回 字符 串 ， 应 
将 其 传 入 int() 这 样 的 画 数 ， 就 可 以 将 '123' 这 样 的 字符 串 转 换 为 对 应 的 数值 123。 当 你 想 要 保存 
更 为 复杂 的 数据 类 型 ， 例 如 嵌 套 的 列表 和 字典 ， 手 工 解析 和 序列 化 它们 将 变 得 更 复杂 。 


好 在 用 户 不 是 非得 自己 编写 和 调试 保存 复杂 数据 类 型 的 代码 ，Python 人 允许 你 使 用 常用 的 数据 
交换 格式 JSON (JavaScript Object Notation) 。 标 准 模块 son 可 以 接受 Python 数据 结构 ， 
并 将 它们 转换 为 字符 串 表示 形式 ; 此 过 程 称 为 序列 化 。 从 字符 串 表 示 形 式 重 新 构建 数据 结构 
称 为 反 序列 化 。 序 列 化 和 反 序 列 化 的 过 程 中 ， 表 示 该 对 象 的 字符 串 可 以 存储 在 文件 或 数据 
中 ， 也 可 以 通过 网 络 连接 传送 给 远程 的 机 器 。 

注意 

JSON 格式 经 常用 于 现代 应 用 程序 中 进行 数据 交换 。 许 多 程序 员 都 已 经 熟悉 它 了 ， 使 它 成 为 
相互 协作 的 一 个 不 错 的 选择 。 


如 果 你 有 一 个 对 象 x， 你 可 以 用 简单 的 一 行 代码 查看 其 ISON 字符 串 表 示 形 式 : 


>>> json.dumps([1, 'simple', 'list']) 
' [1, "simple", "list"] ' 


dumps()ES: 85 5; /.— I 3x Pdump(), BRR ZIMESI— T LA, PAE HS 
入 而 打开 的 一 个 文本 文件 对 象 ， 我 们 可 以 这 样 做 : 


json.dump(x, f) 


为 了 重新 解码 对 象 ， 如 果 f 是 为 读 取 而 打开 的 文本 文件 对 象 : 


x = json.load(f) 


这 种 简单 的 序列 化 技术 可 以 处 理 列表 和 字典 ， 但 序列 化 任意 类 实例 为 JSON 需要 一 点 额外 的 
努力 。Json 模 块 的 手册 对 此 有 详细 的 解释 。 

另 请 参阅 

pickle - pickle 模 块 

与 JSON 不 同 ，pickle 是 一 个 协议 ， 它 允许 任意 复 条 的 Python 对 象 的 序列 化 。 因 此 ， 它 只 能 
用 于 Python 而 不 能 用 来 与 其 他 语言 编写 的 应 用 程序 进行 通信 。 默 认 情 况 下 它 也 是 不 安全 的 : 
如 果 数 据 由 熟练 的 攻击 者 精心 设计 ， 反 序 列 化 来 自 一 个 不 受信 任 源 的 pickle 数据 可 以 执行 任 
意 代码 。 


8. 错误 和 异常 


站 到 现在 ， 我 们 还 没有 更 多 的 提 及 错误 信息 ， 但 是 如 果 你 真 的 尝试 了 前 面 的 例子 ， 也 许 你 已 
经 见 到 过 一 些 。Python (至 少 ) 有 两 种 错误 很 容易 区 分 : 语法 错误 和 异常 。 


8.1. 语法 错误 
语法 错误 ， 或 者 称 之 为 解析 错误 ， 可 能 是 你 在 学 习 Python 过 程 中 最 烦 的 一 种 : 


>>> while True print('Hello world') 
File "<stdin>", line 1, in ? 
while True print('Hello world') 
^ 


SyntaxError: invalid syntax 


语法 分 析 器 指出 了 出 错 的 一 行 ， 并 且 在 最 先 找到 的 错误 的 位 置 标 记 了 一 个 小 小 的 "第 头 '"。 错 误 
是 由 箭头 前 面 的 标记 引起 的 (至 少 检测 到 是 这 样 的 ) : 在 这 个 例子 中 ， 检 测 到 错误 发 生 在 画 
数 print()， 因 为 在 它 之 前 缺少 一 个 冒号 〈':") 。 文 件 名 和 行 号 会 一 并 输出 ， 所 以 如 果 运 行 的 是 
一 个 脚本 你 就 知道 去 哪里 检查 错误 了 。 


8.2. 异常 


即使 一 条 语句 或 表达 式 在 语法 上 是 正确 的 ， 在 运行 它 的 时 候 ， 也 有 可 能 发 生 错误 。 在 执行 其 
间 检 测 到 的 错误 被 称 为 异常 并 且 程 序 不 会 无 条 件 地 崩溃 : 你 很 快 就 会 知道 如 何在 Python 程 
序 中 处 理 它们 。 然 而 大 多 数 异 常 都 不 会 被 程序 处 理 ， 导 致 产生 类 似 下 面 的 错误 信息 : 


>>> 10 * (1/0) 

Traceback (most recent call last): 
File "<stdin>", line 1, in ? 

ZeroDivisionError: division by zero 

>>> 4 + spam*3 

Traceback (most recent call last): 
File "<stdin>", line 1, in ? 

NameError: name 'spam' is not defined 

>>> UEM + 2 

Traceback (most recent call last): 
File "<stdin>", line 1, in ? 

TypeError: Can't convert 'int' object to str implicitly 


最 后 一 行 的 错误 消息 指示 发 生 了 什么 事 。 异 常 有 不 同 的 类 型 ， 其 类 型 会 作为 消息 的 一 部 分 打 
印 出 来 : 在 这 个 例子 中 的 类 型 有 ZeroDivisionError、 NameError 和 TypeError。 打 印 出 来 的 异 
常 类 型 的 字符 串 就 是 内 置 的 异常 的 名 称 。 这 对 于 所 有 内 和 置 的 异常 是 正确 的 ， 但 是 对 于 用 户 自 


定义 的 异常 就 不 一 定 了 〔 尽 管 这 是 非常 有 用 的 惯例 ) 。 标 准 异 常 的 名 称 都 是 内 置 的 标识 符 
(不 是 保留 的 关键 字 ) 。 


这 一 行 最 后 一 部 分 给 出 了 异常 的 详细 信息 和 引起 异常 的 原因 。 


给 误 信息 的 前 面部 分 以 堆栈 回溯 的 形式 显示 了 异常 发 生 的 上 下 文 。 通 常 调用 栈 里 会 包含 源 代 
码 的 行 信 息 ， 但 是 来 自 标准 输入 的 源码 不 会 显示 行 信息 。 


内 置 的 异常 列 出 了 内 置 的 异常 以 及 它们 的 含义 。 


8.3. WER 


可 以 通过 编程 来 选择 处 理 部 分 异常 。 看 一 下 下 面 的 例子 ， 它 会 一 直 要 求 用 户 输入 直到 输入 一 
个 合法 的 整数 为 止 ， 但 允许 用 户 中 断 这 个 程序 (使 用 Control-C 或 系统 支持 的 任何 方法 ) ; 注 
意 用 户 产生 的 中 断 引 发 的 是 Keyboardinterrupt 异常 。 


>>> while True: 
try: 
x = int(input("Please enter a number: ")) 
break 
except ValueError: 
print("Oops! That was no valid number. Try again...") 


Try 语句 按 以 下 方式 工作 。 


e 首先 ， 执 行 try ^) (try 和 和 except 关键 字 之 间 的 语句 ) o 

e 如 果 未 发 生 任 何 异 常 ， 忽 略 except 子 句 且 try 语 句 执行 完毕 。 

e 如 果 在 try 子 句 执行 过 程 中 发 生 异 常 ， 跳 过 该 子 句 的 其 余部 分 。 如 果 异 常 的 类 型 与 except 
关键 字 后 面 的 异常 名 匹配 , 则 执行 except 子 句 ， 然 后 继续 执行 try 语 句 之 后 的 代码 。 

e 如 果 异 常 的 类 型 与 except 关键 字 后 面 的 异常 名 不 匹配 ， 它 将 被 传递 给 上 层 的 try 语 句 ; 如 
果 没 有 找到 处 理 这 个 异常 的 代码 ， 它 就 成 为 一 个 未 处 理 异 常 ， 程 序 会 终止 运行 并 显示 一 
条 如 上 所 示 的 信息 。 


Try 语 句 可 能 有 多 个 子 句 ， 以 指定 不 同 的 异常 处 理 程序 。 不 过 至 多 只 有 一 个 处 理 程 序 将 被 执 
行 。 处 理 程 序 只 处 理发 生 在 相应 try 子 句 中 的 异常 ， 不 会 处 理 同一 个 try 字 句 的 其 他 处 理 程 序 中 
发 生 的 有 异常。 一 个 except 子 句 可 以 用 带 括号 的 元 组 列 出 多 个 异常 的 名 字 ， 例 如 : 


. except (RuntimeError, TypeError, NameError): 
pass 


最 后 一 个 except 子 句 可 以 省 略 异常 名 称 ， 以 当 作 通 配 符 使 用 。 使 用 这 种 方式 要 特别 小 心 ， 
为 它 会 隐藏 一 个 真实 的 程序 错误 ! 它 还 可 以 用 来 打印 一 条 错误 消息 ， 然 后 重新 引发 异常 (让 
调用 者 也 去 义理 这 个 异常 ) 


import sys 


try: 


f = open('myfile.txt') 
s = f.readline() 
i = int(s.strip()) 
except OSError as err: 
print("OS error: {0}".format(err) ) 
except ValueError: 
print("Could not convert data to an integer.") 
except: 
print("Unexpected error:", sys.exc_info()[0]) 
raise 


try...except 语 句 有 一 个 可 选 的 else 子 句 ， 其 出 现时 ， 必 须 放 在 所 有 except 子 句 的 后 面 。 如 果 
需要 在 try 语句 没有 抛 出 异常 时 执行 一 些 代码 ， 可 以 使 用 这 个 子 句 。 例 如 : 


for arg in sys.argv[1:]: 

try: 
f = open(arg, 'r') 

except IOError: 
print('cannot open', arg) 

else: 
print(arg, 'has', len(f.readlines()), 'lines') 
f.close() 


使 用 else 子 句 比 把 额外 的 代码 放 在 try 子 句 中 要 好 ， 因 为 它 可 以 避免 意外 捕获 不 是 由 try .… 保 护 
的 代码 所 引发 的 异常 。 除 了 语句 。 


当 异 常 发 生 时 ， 它 可 能 带 有 相关 数据 ， 也 称 为 异常 的 参数 。 参 数 的 有 无 和 类 型 取决 于 异常 的 


类 型 。 


except 子 句 可 以 在 异常 名 之 后 指定 一 个 变量 。 这 个 变量 将 绑 定 于 一 个 异常 实例 ， 同 时 异常 的 
参数 将 存放 在 实例 的 args 中 。 为 方便 起 见 ， 异 常 实例 定义 了 str() ， 因 此 异常 的 参数 可 以 直接 
打印 而 不 必 引 用 .args。 也 可 以 在 引发 异常 之 前 先 实 例 化 一 个 异常 ， 然 后 向 它 添加 任何 想 要 的 
属性 。 


>>> try: 
raise Exception('spam', 'eggs') 
. except Exception as inst: 


print(type(inst)) # the exception instance 
print(inst.args) arguments stored in .args 
print(inst) # str allows args to be printed directly, 


# but may be overridden in exception subclasses 
X, y = inst.args # unpack args 
print('x =', x) 
print('y -', y) 


«class 'Exception'» 
('spam', 'eggs') 
('spam', 'eggs') 

X = spam 

y = eggs 


对 于 未 处 理 的 有 异常， 如果 它 含有 参数 ， 那 么 参数 会 作为 异常 信息 的 最 后 一 部 分 打印 出 来 。 


异常 处 理 程序 不 仅 处 理 直 接 发 生 在 try 子 句 中 的 异常 ， 而 且 还 处 理 ty 子 句 中 调用 的 函数 (其 
至 间接 调用 的 函数 ) 引发 的 异常 。 例 如 : 


>>> def this_fails(): 
x = 1/0 


>>> try: 
this_fails() 
. except ZeroDivisionError as err: 
print('Handling run-time error:', err) 


Handling run-time error: int division or modulo by zero 


8.4. 引发 异常 
raise 语 句 人 允许 程序 员 强 行 引 发 一 个 指定 的 异常 。 例 如 : 


>>> raise NameError('HiThere' ) 
Traceback (most recent call last): 

File "<stdin>", line 1, in ? 
NameError: HiThere 


raise 的 唯一 参数 指示 要 引发 的 异常 。 它 必须 是 一 个 异常 实例 或 异常 类 (从 Exception 派 生 的 


类 ) 。 


如 果 你 确定 需要 引发 异常 ， 但 不 打算 处 理 它 ， 一 个 简单 形式 的 raise 语 句 允 许 你 重新 引发 异 
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>>> try: 
raise NameError('HiThere' ) 
. except NameError: 
print('An exception flew by!') 
raise 


An exception flew by! 

Traceback (most recent call last): 
File "«stdin»", line 2, in ? 

NameError: HiThere 


8.5. 用 户 定 义 的 异常 


程序 可 以 通过 创建 新 的 异常 类 来 命名 自己 的 异常 (Python 类 的 更 多 内 容 请 参见 类 ) 。 异 常 通 
常 应 该 继承 Exception 类 ， 直 接 继承 或 者 间接 继承 都 可 以 。 例 如 : 


>>> class MyError(Exception): 
def | init (self, value): 
self.value - value 
def | str (self): 
return repr(self.value) 


>>> try: 
raise MyError(2*2) 
. except MyError as e: 


print('My exception occurred, value:', e.value) 


My exception occurred, value: 4 

>>> raise MyError('oops!') 

Traceback (most recent call last): 
File "«stdin»", line 1, in ? 

. main .MyError: 'oops!' 


在 此 示例 中 ，Exception 默 认 的 init() 被 覆盖 了 。 新 的 行为 简单 地 创建 了 val/ue 属性 。 这 将 替换 
默认 的 创建 args 属性 的 行为 。 


异常 类 可 以 像 其 他 类 一 样 做 任何 事情 ， 但 是 通常 都 会 比较 简单 ， 只 提供 一 些 属性 以 允许 异常 
义理 程序 获取 错误 相关 的 信息 。 创 建 一 个 能 够 引发 几 种 不 同 错误 的 模块 时 ， 一 个 通常 的 做 法 
是 为 该 模块 定义 的 异常 创建 一 个 基 类 ， 然 后 基于 这 个 基 类 为 不 同 的 错误 情况 创建 特定 的 子 
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class Error(Exception): 
"""Base class for exceptions in this module.""" 
pass 


class InputError(Error): 
"""Exception raised for errors in the input. 


Attributes: 
expression -- input expression in which the error occurred 
message -- explanation of the error 


def _ init (self, expression, message): 
self.expression - expression 
self.message - message 


class TransitionError(Error): 
"""Raised when an operation attempts a state transition that's not 


allowed. 
Attributes: 
previous -- state at beginning of transition 
next -- attempted new state 
message -- explanation of why the specific transition is not allowed 


def _ init (self, previous, next, message): 
self.previous - previous 
self.next - next 
self.message - message 


大 多 数 异 常 的 名 字 都 以 "Error" 结 尾 ， 类 似 于 标准 异常 的 命名 。 

很 多 标准 模块 中 都 定义 了 自己 的 异常 来 报告 在 它们 所 定义 的 函数 中 可 能 发 生 的 错误 。 类 这 一 
章 给 出 了 类 的 详细 信息 。 

8.6. 定义 清理 操作 

Try 语句 有 另 一 个 可 选 的 子 句 ， 目 的 在 于 定义 必须 在 所 有 情况 下 执行 的 清理 操作 。 例 如 : 


>>> try: 
raise KeyboardInterrupt 
finally: 
print('Goodbye, world!') 


Goodbye, world! 
KeyboardInterrupt 


不 管 有 没有 发 生 异 常 ， 在 离开 try 语 句 之 前 总 是 会 执行 finally 子 句 。 当 try 子 句 中 发 生 了 一 个 异 
常 ， 并 且 没 有 except 字 句 处 理 (或 者 异常 发 生 在 try 或 else 子 句 中 ) ， 在 执行 完 finally 子 句 后 将 
重新 引发 这 个 异常 。try 语 句 由 于 break、contine 或 return 语 句 离开 时 ， 同 样 会 执行 finally 子 
句 。 下 面 是 一 个 更 复杂 些 的 例子 : 


>>> def divide(x, y): 
try: 
result =x/y 
except ZeroDivisionError: 
print("division by zero!") 
else: 
print("result is", result) 
finally: 
print("executing finally clause") 


>>> divide(2, 1) 

result is 2.0 

executing finally clause 

>>> divide(2, 0) 

division by zero! 

executing finally clause 

>>> divide("2", "1") 

executing finally clause 

Traceback (most recent call last): 
File "«stdin»", line 1, in ? 
File "«stdin»", line 3, in divide 

TypeError: unsupported operand type(s) for /: 'str' and 'str' 


正如 您 所 看 到 的 ， 在 任何 情况 下 都 会 执行 finally 子 句 。 由 两 个 字符 串 相 除 引 发 的 TypeError 异 
常 没有 被 except 子 句 处 理 ， 因 此 在 执行 finally 子 句 后 被 重新 引发 。 


在 真实 的 应 用 程序 中 ， finally 子 句 用 于 释放 外 部 资源 (例如 文件 或 网 络 连 接 ) ， 不 管 资源 的 使 
用 是 否 成 功 。 
8.7. 清理 操作 的 预定 义 


有 些 对 象 定义 了 在 不 需要 该 对 象 时 的 标准 清理 操作 ， 无 论 该 对 象 的 使 用 是 成 功 还 是 失败 。 看 
看 下 面 的 示例 ， 它 尝试 打开 一 个 文件 并 打印 其 内 容 到 屏幕 。 


for line in open("myfile.txt"): 
print(line, end="") 


这 段 代码 的 问题 就 是 这 部 分 代码 执行 完 之 后 它 还 会 让 文件 在 一 段 不 确定 的 时 间 内 保持 打开 状 
态 。 这 在 简单 的 脚本 中 没什么 ， 但 是 在 大 型 应 用 程序 中 可 能 是 一 个 问题 。With 语 句 可 以 确保 
像 文件 这 样 的 对 象 总 能 及 时 准确 地 被 清理 掉 。 


with open("myfile.txt") as f: 
for line in f: 
print(line, end="") 


执行 该 语句 后 ， 文 件 f 将 始终 被 关闭 ， 即 使 在 处 理 某 一 行 时 遇 到 了 问题 。 提 供 预 定义 的 清理 行 
为 的 对 象 ， 和 文件 一 样 ， 会 在 它们 的 文档 里 说 明 。 


9. X 


与 其 他 编程 语言 相 比 ，Python 的 类 机 制 用 最 少 的 语法 和 语义 引入 了 类 。 它 是 C++ 和 Modula- 
3 类 机 制 的 混合 。Python 的 类 提供 了 面向 对 象 编程 的 所 有 标准 功能 : 类 继承 机 制 允 许 有 多 个 
基 类 ， 继 承 的 类 可 以 履 盖 其 基 类 或 类 的 任何 方法 ， 方 法 能 够 以 相同 的 名 称 调用 基 类 中 的 方 
法 。 对 象 可 以 包含 任意 数量 和 种 类 的 数据 。 和 模块 一 样 ， 类 同样 具有 Python 的 动态 性 质 : 它 
们 在 运行 时 创建 ， 并 可 以 在 创建 之 后 进一步 修改 。 


用 C++ 术语 来 讲 ， 通 常情 况 下 类 成 员 (包括 数据 成 员 ) 是 公有 的 〈 其 它 情 况 见 下 文 私有 变 
=), MARR AKAAERE 的 。 与 Modula-3 一 样 ， 在 成 员 方 法 中 没有 简便 的 方式 引用 对 
象 的 成 员 : 方法 函数 的 声明 用 显 式 的 第 一 个 参数 表示 对 象 本 身 ， 调 用 时 会 隐 式 地 引用 该 对 
象 。 与 Smalltalk 一 样 ， 类 本 身 也 是 对 象 。 这 给 导入 类 和 重 命 名 类 提供 了 语义 上 的 合理 性 。 刁 
C++ 和 Modula-3 不 同 ， 用 户 可 以 用 内 置 类 型 作为 基 类 进行 扩展 。 此 外 ， 像 C++ 一 样 ， 类 实 
例 可 以 重 定义 大 多 数 带 有 特殊 语法 的 内 置 操 作 符 (算术 运算 符 、 下 标 等 ) 。 


(由 于 没有 统一 的 达成 共识 的 术语 ， 我 会 偶尔 使 用 SmallTalk 和 C++ 的 术语 。 我 比较 喜欢 用 
Modula-3 的 术语 ， 因 为 比 起 C++, Python 的 面向 对 象 语法 更 像 它 ， 但 是 我 想 很 少 有 读者 听 
说 过 它 。) 


9.1. 名 称 和 对 象 


对 象 是 独立 的 ， 多 个 名 字 (在 多 个 作用 域 中 ) 可 以 绑 定 到 同一 个 对 象 。 这 在 其 他 语言 中 称 为 
别名 。 第 一 次 粗略 浏览 Python 时 经 常 不 会 注意 到 这 个 特性 ， 而 且 人 处 理 不 可 变 的 基本 类 型 ( 数 
字 ， 字 符 串 ， 元 组 ) 时 忽略 这 一 点 也 没什么 问题 。 然 而 ， 在 Python 代码 涉及 可 变 对 象 如 列 
表 、 字典 和 大 多 数 其 它 类 型 时 ， 别 名 可 能 具有 意 想 不 到 语义 效果 。 这 通常 有 助 于 优化 程序 ， 
因为 别名 的 行为 在 某 些 方面 类 似 指 针 。 例 如 ， 传 递 一 个 对 象 的 开销 是 很 小 的 ， 因 为 在 实现 上 
只 是 传递 了 一 个 指针 ; 如 果 画 数 修 改 了 参数 传递 的 对 象 ， 调 用 者 也 将 看 到 变化 一 一 这 就 避免 
了 类 似 Pascal 中 需要 两 个 不 同 参 数 的 传递 机 制 。 


9.2. Python 作用 域 和 命名 空间 


在 介绍 类 之 前 ， 首 先 我 要 告诉 你 一 些 有 关 Python 作用 域 的 的 规则 。 类 的 定义 非常 巧妙 的 运用 
了 命名 空间 ， 要 完全 理解 接 下 来 的 知识 ， 需 要 先 理 解 作 用 域 和 命名 空间 的 工作 原理 。 另外 ， 
这 一 切 的 知识 对 于 任何 高 级 Python 程序 员 都 非常 有 用 。 


让 我 们 从 一 些 定 义 开 始 。 


命名 空间 是 从 名 称 到 对 象 的 映射 。 当 前 命名 空间 主要 是 通过 Python 字典 实现 的 ， 不 过 通常 不 
会 引起 任何 关注 (除了 性 能 方面 ) ， 它 以 后 也 有 可 能 会 改变 。 以 下 有 一 些 命名 空间 的 例子 : 
内 置 名 称 集 《包括 本 数 名 列 如 abs() 和 内 置 异 常 的 名 称 ) ; 模块 中 的 全 局 名 称 BIB 


局 部 名 称 。 在 某 种 意义 上 的 一 组 对 象 的 属性 也 形成 一 个 命名 空间 。 关 于 命名 空间 需要 知道 的 
重要 一 点 是 不 同 命名 空间 的 名 称 绝 对 没有 任何 关系 ; Ol, ARAB T ELE XE 3C ER ZR 
maximize 而 不 会 产生 混淆 模块 的 使 用 者 必须 以 模块 名 为 前 级 引用 它们 。 





顺便 说 一 句 ， 我 使 用 属性 这 个 词 称呼 点 后 面 的 任何 名 称 例如 ， 在 表达 式 z.real 中 ，real 
是 z 对 象 的 一 个 属性 。 严 格 地 说 ， 对 模块 中 的 名 称 的 引用 是 属性 引用 : 在 表达 式 
modname.funcname 中 ， modname 是 一 个 模块 对 象 ，funcname 是 它 的 一 个 属性 。 在 这 种 情 
况 下 ， 模 块 的 属性 和 模块 中 定义 的 全 局 名 称 之 间 碰 巧 是 直接 的 映射 : 它们 共享 同一 命名 空间 
! [1] 


属性 可 以 是 只 读 的 也 可 以 是 可 写 的 。 在 后 一 种 情况 下 ， 可 以 对 属性 赋值 。 模 块 的 属性 都 是 可 
BA : 你 可 以 这 样 写 modname.the_answer=42。 可 宇 的 属性 也 可 以 用 del 语 句 删除 。 例 如 ， 
delmodname.the_answer 将 会 删除 对 象 modname 中 的 the_answer 属 性 。 





各 个 命名 空间 创建 的 时 刻 是 不 一 样 的 ， 且 有 着 不 同 的 生命 周期 。 包 含 内 置 名 称 的 命名 空间 在 
Python 解释 器 启动 时 创建 ， 永 远 不 会 被 删除 。 模 块 的 全 局 命名 空间 在 读 人 模块 定义 时 创建 ; 
通常 情况 下 ， 模 块 命名 空间 也 会 一 直 保存 到 解释 器 退出 。 在 解释 器 最 外 层 调 用 执行 的 语句 ， 
不 管 是 从 脚本 文件 中 读 和 人 还 是 来 自 交 互 式 输 入 ， 都 被 当 作 模块 main 的 一 部 分 ， 所 以 它们 有 它 
们 自己 的 全 局 命名 空间 。 《内 置 名 称 实际 上 也 存在 于 一 个 模块 中 ， 这 个 模块 叫 builtins。 ) 


本 数 的 局 部 命名 空间 在 函数 调用 时 创建 ， 在 郴 数 返回 或 者 引发 了 一 个 画 数 内 部 没有 义理 的 录 
常 时 删除 。 (实际 上 ， 用 遗忘 来 形容 到 底 发 生 了 什么 更 为 贴切 。) 当 然 ， 每 个 递 当 调用 有 它们 
自己 的 局 部 命名 空间 。 


作用 域 是 Python 程序 中 可 以 直接 访问 一 个 命名 空间 的 代码 区 域 。 这 里 的 "直接 访问 "的 意思 是 
用 没有 前 级 的 引用 在 命名 空间 中 找到 的 相应 的 名 称 。 


虽然 作用 域 的 确定 是 静态 地 ， 但 它们 的 使 用 是 动态 地 。 程 序 执行 过 程 中 的 任何 时 候 ， 至 少 有 
三 个 嵌 套 的 作用 域 ， 它 们 的 命名 空间 是 可 以 直接 访问 的 : 


。 首先 搜索 最 里 面包 含 局 部 命名 的 作用 域 

。 其 次 搜索 所 有 调用 孙 数 的 作用 域 ， 从 最 内 层 调用 孙 数 的 作用 域 开 始 ， 它 们 包含 非 局 部 但 
也 非 全 局 的 命名 

。 倒数 第 二 个 搜索 的 作用 域 是 包含 当前 模块 全 局 命名 的 作用 域 

。 最 后 搜索 的 作用 域 是 最 外 面包 含 内 置 命名 的 命名 空间 


如 果 一 个 命名 声明 为 全 局 的 ， 那 么 对 它 的 所 有 引用 和 赋值 会 直接 搜索 包含 这 个 模块 全 局 命名 
的 作用 域 。 如 果 要 重新 绑 定 最 里 层 作 用 域 之 外 的 变量 ， 可 以 使 用 nonlocal 语 句 ; 如 果 不 声明 为 
nonlocal， 这 些 变量 将 是 只 读 的 〈 对 这 样 的 变量 赋值 会 在 最 里 面 的 作用 域 创建 一 个 新 的 局 部 
变量 ， 外 部 具有 相同 命名 的 那个 变量 不 会 改变 ) 。 


通常 情况 下 ， 局 部 作用 域 引用 当前 函数 的 本 地 命名 。 男 数 之 外 ， 局 部 作用 域 引用 的 命名 空间 
与 全 局 作用 域 相同 : 模块 的 命名 空间 。 类 定义 在 局 部 命名 空间 中 创建 了 另 一 个 命名 空间 。 


认识 到 作用 域 是 由 代码 确定 的 是 非常 重要 的 : 函数 的 全 局 作用 域 是 函数 的 定义 所 在 的 模块 的 
命名 空间 ， 和 与 范 数 调用 的 位 置 或 者 别名 无 关 。 另 一 方面 ， 命 名 的 实际 搜索 过 程 是 动态 的 ， 在 
运行 时 确定 的 一 一 然而 ，Python 语言 也 在 不 断 发 展 ， 以 后 有 可 能 会 成 为 静态 的 “编译 ”时 确 
定 ， 所 以 不 要 依赖 动态 解析 ! (事实 上 ， 本 地 变量 是 已 经 确定 静态 。) 


Python 的 一 个 特别 之 处 在 于 一 一 如 果 没 有 使 用 global 语 法 一 一 其 赋值 操作 总 是 在 最 里 层 的 作用 
域 。 赋 值 不 会 复制 数据 一 只 是 将 命名 绑 定 到 对 象 。 删 除 也 是 如 此 : delx 只 是 从 局 部 作用 域 的 
命名 空间 中 删除 命名 x。 事 实 上 ， 所 有 引入 新 命名 的 操作 都 作用 于 局 部 作用 域 : 特别 是 import 
语句 和 图 数 定 将 模块 名 或 画 数 绑 定 于 局 部 作用 域 。( 可 以 使 用 Global 语句 将 变量 引入 到 全 局 作 
用 域 。) 








global 语 句 可 以 用 来 指明 某 个 特定 的 表明 位 于 全 局 作用 域 并 且 应 该 在 那里 重新 绑 定 ; nonlocal 
语句 表示 特定 的 变量 位 于 一 个 封闭 的 作用 域 并 且 应 该 在 那里 重新 绑 定 。 


9.2.1. 作用 域 和 命名 空间 示例 


下 面 这 个 示例 演示 如 何 访问 不 同 作用 域 和 命名 空间 ， 以 及 global 和 nonlocal 如 何 影响 变量 的 
绑 定 : 


def scope_test(): 
def do_local(): 
spam = "local spam" 
def do_nonlocal(): 
nonlocal spam 
spam = "nonlocal spam" 
def do_global(): 
global spam 
spam = "global spam" 
spam = "test spam" 
do_local() 
print("After local assignment:", spam) 
do nonlocal() 
print("After nonlocal assignment:", spam) 
do global() 
print("After global assignment:", spam) 


scope test() 
print("In global scope:", spam) 


示例 代码 的 输出 为 : 


After local assignment: test spam 

After nonlocal assignment: nonlocal spam 
After global assignment: nonlocal spams. 
In global scope: global spam 


ER, locali&i& (默认 行为 ) 没有 改变 scope_test*spam 的 绑 定 。nonlocal 赋 值 改变 了 
scope_test 对 spam 的 绑 定 ，global 赋 值 改 变 了 模块 级 别 的 绑 定 。 


你 也 可 以 看 到 在 global 语 句 之 前 没有 对 spam 的 绑 定 。 


9.3. 初 识 类 


类 引入 了 少量 的 新 语法 、 三 种 新 对 象 类 型 和 一 些 新 语义 。 


9.3.1 . 类 十 定义 语法 
类 定义 的 最 简单 形式 如 下 所 示 : 


class ClassName: 
<statement-1> 


<statement -N> 


类 的 定义 就 像 画 数 定义 (defi) ， 要 先 执行 才能 生效 。( 你 当然 可 以 把 它 放 进 if 语句 的 某 一 
分 支 ， 或 者 一 个 函数 的 内 部 。 ) 


实际 应 用 中 ， 类 定义 包含 的 语句 通常 是 函数 定义 ， 不 过 其 它 语 句 也 是 可 以 的 而 且 有 时 还 会 
有 用 一 -后面 我 们 会 再 回来 讨论 。 类 中 的 函数 定义 通常 有 一 个 特殊 形式 的 参数 列表 ， 这 是 
方法 调用 的 协议 决定 


进入 类 定义 部 分 后 ， 会 创建 出 一 个 新 的 命名 空间 ， 作 为 局 部 作用 域 一 一 因此 ， 所 有 的 赋值 成 
为 这 个 新 命名 空间 的 局 部 变量 。 特 别 是 这 里 的 本 数 定义 会 绑 定 新 函数 的 名 字 。 


很 
由 





类 定义 正常 退出 时 ， 一 个 类 对 象 也 就 创建 了 。 基 本 上 它 类 定义 创建 的 命名 空间 进行 了 一 
个 包装 ; 我 们 在 下 一 节 将 进一步 学 习 类 对 象 的 知识 。 Barium 定义 引入 之 前 生 

效 的 那个 ) 得 到 恢复 ， 类 对 象 在 这 里 绑 定 到 类 定义 头 部 的 类 名 (例子 中 是 ClassName) 。 

9.3.2. 类 对 象 

类 对 象 支持 两 种 操作 : 属性 引用 和 实例 化 。 


属性 引用 使 用 的 所 有 属性 引用 在 Python 中 使 用 的 标准 语法 : obj.name。 有 效 的 属性 名 称 是 
在 该 类 的 命名 空间 中 的 类 对 象 被 创建 时 的 所 有 名 称 。 因 此 ， 如 果 类 定义 看 起 来 像 这 样 : 


class MyClass: 
"A simple example class""" 
i = 12345 
def f(self): 
return 'hello world' 


那么 MyClass.i 和 MyClass.f 是 有 效 的 属性 引用 ， 分 别 返 回 一 个 整数 和 一 个 方法 对 象 。 E 
RR diu LOUER X RD 
的 文档 字符 串 : "Asimpleexampleclass", 


类 的 实例 化 使 用 函数 的 符号 。 可 以 假设 类 对 象 是 一 个 不 带 参 数 的 画 数 ， 该 落 数 返回 这 个 类 的 
一 个 新 的 实例 。 例 如 (假设 治 用 上 面 的 类 ) 


x = MyClass() 


创建 这 个 类 的 一 个 新 实例 ， 并 将 该 对 象 赋 给 局 部 变量 x。 


实例 化 操作 (〈“ 调 用 "一 个 类 对 象 ) 将 创建 一 个 空 对 象 。 很 多 类 和 希望 创建 的 对 象 可 以 自 定义 一 个 
初始 状态 。 ie d MER 像 下 面 这 样 : 


def | init (self): 
self.data - [] 


当 类 定义 了 init() 方 法 ， 类 的 实例 化 会 为 新 创建 的 类 实例 自动 调用 init()。 所 以 在 下 面 的 示例 
中 ， 可 以 获得 一 个 新 的 、 已 初始 化 的 实例 : 


x = MyClass() 


当然 ，init() 方 法 可 以 带 有 参数 ， 这 将 带 来 更 大 的 灵活 性 。 在 这 种 情况 下 ， 类 实例 化 操作 的 参 
数 将 传递 给 init()。 例 如 ， 


>>> class Complex: 
def _ init (self, realpart, imagpart): 
self.r = realpart 
self.i = imagpart 


>>> x = Complex(3.0, -4.5) 


SEE Kaliy Koal 
(3.0, -4.5) 


9.3.3. 实例 对 象 


现在 我 们 可 以 用 实例 对 象 做 什么 ? 实例 对 象 唯一 可 用 的 操作 就 是 属性 引用 。 有 两 种 有 效 的 属 
性 名 : 数据 属性 和 方法 。 


数据 属性 相当 于 Smalltalk 中 的 "实例 变量 "或 C++ 中 的 "数据 成 员 "。 数 据 属性 不 需要 声明 ; 和 
局 部 变量 一 样 ， 它 们 会 在 第 一 次 给 它们 赋值 时 生成 。 例 如 ， 如 果 x 是 上 面 创 建 的 MyClass 的 实 
例 ， 下 面 的 代码 段 将 打印 出 值 16 而 不 会 出 现 错误 : 


x.counter = 1 

while x.counter < 10: 
x.counter = x.counter * 2 

print(x.counter) 

del x.counter 


实例 属性 引用 的 另 一 种 类 型 是 方法 。 方 法 是 "属于 "一 个 对 象 的 函数 。 (在 Python， 方 法 这 个 
术语 不 只 针对 类 实例 : 其 他 对 象 类 型 也 可 以 具有 方法 。 例 如 ， 列 表 对 象 有 append, insert, 
remove, sot 方法 等 等 。 但 是 在 后 面 的 讨论 中 ， 除 非 明确 说 明 ， 我 们 提 到 的 方法 特 指 类 实例 
对 象 的 方法 。) 


实例 对 象 的 方法 的 有 效 名 称 依赖 于 它 的 类 。 根 据 定义 ， 类 中 所 有 阔 数 对 象 的 属性 定义 了 其 实 
例 中 相应 的 方法 。 所 以 在 我 们 的 示例 中 ，x.f 是 一 个 有 效 的 方法 的 引用 ， 因 为 MyClass.f 是 一 个 
函数 ， 但 x.i 不 是 ， 因 为 MyClass.i 不 是 一 个 函数 。 但 x.f{ 与 MyClass.f 也 不 是 一 回 事 一 一 它 是 一 
个 方法 对 象 ， 不 是 一 个 函数 对 象 。 


9.3.4. 方法 对 象 
通常 情况 下 ， 方 法 在 绑 定 之 后 被 直接 调用 : 


x.f() 


在 MyClass 的 示例 中 ， 这 将 返回 字符 串 'helloworld'。 然 而 ， 也 不 是 一 定 要 直接 调用 方法 : xf 
是 一 个 方法 对 象 ， 可 以 存储 起 来 以 后 调用 。 例 如 : 


ar Sak 
while True: 
print(xf()) 


会 不 断 地 打印 helloworld。 


调用 方法 时 到 底 发 生 了 什么 ?你 可 能 已 经 注意 到 ， 上 面 x.f() 的 调用 没有 参数 ， 即 使 f ERA B 
定义 指定 了 一 个 参数 。 该 参数 发 生 了 什么 问题 ? 当然 如 果 辑 数 调用 中 缺少 参数 Python 会 抛 出 
异常 一 一 即使 这 个 参数 实际 上 没有 合用... 


实际 上 ， 你 可 能 已 经 猜 到 了 答案 : 方法 的 特别 之 处 在 于 实例 对 象 被 作为 函数 的 第 一 个 参数 传 
给 了 加 数 。 在 我 们 的 示例 中 ， 调 用 x.f() 完 全 等 同 于 MyClass.f(x)。 一 般 情 况 下 ， 以 n 个 参数 的 
列表 调用 一 个 方法 就 相当 于 将 方法 所 属 的 对 象 插入 到 列表 的 第 一 个 参数 的 前 面 ， 然 后 以 新 的 
列表 调用 相应 的 函数 。 


如 果 你 还 是 不 明白 方法 的 工作 原理 ， 了 解 一 下 它 的 实现 或 许 有 帮助 。 引 用 非 数据 属性 的 实例 
属性 时 ， 会 搜索 它 的 类 。 如 果 这 个 命名 确认 为 一 个 有 效 的 函数 对 象 类 属性 ， 就 会 将 实例 对 象 
AIRE xt RET TARR: 这 就 是 方法 对 象 。 以 一 个 参数 列表 调用 方法 对 象 时 ， 它 被 
重新 拆 封 ， 用 实例 对 象 和 原始 的 参数 列表 构造 一 个 新 的 参数 列表 ， 然 后 男 数 对 象 调用 这 个 新 
的 参数 列表 。 


9.3.5. 类 和 实例 变量 
一 般 来 说 ， 实 例 变量 用 于 对 每 一 个 实例 都 是 唯一 的 数据 ， 类 变量 用 于 类 的 所 有 实例 共享 的 属 
性 和 方法 : 
class Dog: 
kind = 'canine' # class variable shared by all instances 


def | init (self, name): 
self.name - name # instance variable unique to each instance 


>>> d = Dog('Fido') 
>>> e = Dog('Buddy') 


>>> d.kind # shared by all dogs 
'canine' 

>>> e.kind # shared by all dogs 
'canine' 

>>> d.name unique to d 

'Fido' 

>>> e.name # unique toe 
"Buddy ' 


正如 在 名 称 和 对 象 讨 论 的 ， 可 变 对 象 ， 例 如 列表 和 字典 ， 的 共享 数据 可 能 带 来 意外 的 效果 。 
例如 ， 下 面 代 码 中 的 tricks 列表 不 应 该 用 作 类 变量 ， 因 为 所 有 的 Dog 实例 将 共享 同一 个 列表 : 


class Dog: 


>>> 


tricks = [] # mistaken use of a class variable 


def _ init (self, name): 


self.name - name 


def add trick(self, trick): 


self.tricks.append(trick) 


- Dog('Fido') 
= Dpog('Buddy') 


.add trick('roll over') 
.add trick('play dead') 
.tricks # unexpectedly shared by all dogs 


['roll over', 'play dead'] 


这 个 类 的 正确 设计 应 该 使 用 一 个 实例 变量 : 


class Dog: 


>>> 


def _ init (self, name): 


self.name - name 
self.tricks - [] # creates a new empty list for each dog 


def add trick(self, trick): 


self.tricks.append(trick) 


= Dog('Fido') 
- Dog('Buddy') 


.add trick('roll over') 
.add trick('play dead') 
.tricks 


['roll over'] 
>>> e.tricks 
['play dead'] 


9.4. 补充 说 明 


数据 属性 会 覆盖 同名 的 方法 属性 ; 为 了 避免 意外 的 命名 冲突 ， 这 在 大 型 程序 中 可 能 带 来 极 难 
发 现 的 bug， 使 用 一 些 约定 来 减少 冲突 的 机 会 是 明智 的 。 可 能 的 约定 包括 大 写 方 法 名 称 的 首 
字母 ， 使 用 一 个 唯一 的 小 写 的 字符 串 (也 许 只 是 一 个 下 划 线 ) 作为 数据 属性 名 称 的 前 级 ， 或 
者 方法 使 用 动词 而 数据 属性 使 用 名 词 。 


数据 属性 可 以 被 方法 引用 ， 也 可 以 由 一 个 对 象 的 普通 用 户 (“ 客 户 端 ") 使 用 。 换 句 话说 ， 类 是 
不 能 用 来 实现 纯 抽 象 数据 类 型 。 事 实 上 ，Python 中 不 可 能 强制 隐藏 数据 一 一 一 切 基于 约定 。 
( 另 一 方面 ， 如 果 需 要 ， 使 用 C 编写 的 Python 实现 可 以 完全 隐藏 实现 细节 并 控制 对 象 的 访 


问 ; 这 可 以 用 来 通过 C 语言 扩展 Python。 ) 


客户 应 该 谨慎 的 使 用 数据 属性 一 一 客户 可 能 通过 践踏 他 们 的 数据 属性 而 使 那些 由 方法 维 扩 的 
常量 变 得 混乱 。 注 意 : 只 要 能 避免 冲突 ， 客 户 可 以 向 一 个 实例 对 象 添加 他 们 自己 的 数据 属 
性 ， TAEAE EATEN — ERE: 命名 约定 可 以 避免 很 多 麻烦 。 


从 方法 内 部 引用 数据 属性 (或 其 他 方法 ) 并 没有 快捷 方式 。 我 觉得 这 实际 上 增加 了 方法 的 可 
读 性 : 当 浏 览 一 个 方法 时 ， 在 局 部 变量 和 实例 变量 之 间 不 会 出 现 eme 


通常 ， 方 法 的 第 一 个 参数 称 为 self。 这 仅仅 是 一 个 约定 : 名 字 self 对 Python 而 言 绝 对 没有 任何 
特殊 含义 。 但 是 请 注意 : 如 果 不 遵 循 这 个 约定 ， 对 其 他 的 Python 程序 员 而 言 你 的 代码 可 读 性 
就 会 变 差 ， 而 且 有 些 类 查看 器 程序 也 可 能 是 遵循 此 约定 编写 的 。 


类 属性 的 任何 函数 对 象 都 为 那个 类 的 实例 定义 了 一 个 方法 。 辑 数 定 义 代码 不 一 定 非得 定义 在 
类 中 : 也 可 以 将 一 个 画 数 对 象 赋值 给 类 中 的 一 个 局 部 变量 。 例 如 : 


# Function defined outside the class 
def fi(self, x, y): 
return min(x, x+y) 


class C: 
f = f1 
def g(self): 
return 'hello world' 
h = 9 


现在 fg 和 h 都 是 类 C 中 引用 画 数 对 象 的 属性 ， 因 此 它们 都 是 c 的 实例 的 方法 
于 g。 请 注意 ， 这 种 做 法 通常 只 会 混淆 程序 的 读者 。 


h 完 全 等 同 





通过 使 用 self 利 用 参数 的 方法 属性 ， 可 以 调用 其 他 方法 : 


class Bag: 

def | init (self): 
self.data - [] 

def add(self, x): 
self.data.append(x) 

def addtwice(self, x): 
self.add(x) 
self.add(x) 


方法 可 以 像 普 通 范 数 那样 引用 全 局 命名 。 与 方法 关联 的 全 局 作用 域 是 包含 类 定义 的 模块 。 
(类 本 身 永远 不 会 做 为 全 局 作用 域 使 用 。) 尽管 很 少 有 好 的 理由 在 方法 中 使 用 全 局 数据 ， 全 
局 作用 域 确 有 很 多 合法 的 用 途 : 其 一 是 方法 可 以 调用 导入 全 局 作用 域 的 函数 和 方法 ， 也 可 以 
调用 定义 在 其 中 的 类 和 郴 数 。 通 常 ， 包 含 此 方法 的 类 也 会 定义 在 这 个 全 局 作用 域 ， 在 下 一 
我 们 会 了 解 为 何 一 个 方法 要 引用 自己 的 类 。 


每 个 值 是 都 一 个 对 象 ， 因 此 每 个 值 都 有 一 个 类 〈 也 称 它 的 类 型 ) 。 它 存储 为 object.class。 


9.5. 继承 
当然 ， 一 个 语言 特性 不 支持 继承 是 配 不 上 “类 ”这 个 名 字 的 。 派 生 类 定义 的 语法 如 下 所 示 : 


class DerivedClassName(BaseClassName): 
<statement -1> 


<statement -N> 


BaseClassName 必 须 与 派生 类 定义 在 一 个 作用 域内 。 用 其 他 任意 表达 式 代 替 基 类 的 名 称 也 是 
允许 的 。 这 可 以 是 有 用 的 ， 例 如 ， 当 基 类 定义 在 另 一 个 模块 中 时 : 


class DerivedClassName(modname.BaseClassName) : 


派生 类 定义 的 执行 过 程 和 基 类 是 相同 的 。 类 对 象 创 建 后 ， 基 类 会 被 保存 。 这 用 于 解析 属性 的 
引用 : 如 果 在 类 TAN 请 求 的 属性 ， 搜 索 会 在 基 类 中 继续 。 如 果 基 类 本 身 是 由 别 的 类 派生 
而 来 ， 这 个 规则 会 递归 应 用 。 


派生 类 的 实例 化 没有 什么 特殊 之 处 : DerivedClassName() 创 建 类 的 一 个 新 的 实例 。 方 法 的 引 
用 按 如 下 规则 解析 : 搜索 对 应 的 类 的 属性 ， 必 要 时 治 基 类 链 逐 级 搜索 ， 如 果 找 到 函数 对 象 
这 个 方法 引用 就 是 合法 的 。 


派生 的 类 可 能 重 写 其 基 类 的 方法 。 因 为 方法 调用 同一 个 对 象 中 的 其 它 方法 时 没有 特权 ， 基 类 
的 方法 调用 同一 个 基 类 的 方法 时 ， 可 能 实际 上 最 终 调用 了 派生 类 中 的 覆盖 方法 。 (对 于 C++ 
程序 员 : Python 中 的 所 有 方法 实际 上 都 是 虚 的 。) 


派生 类 中 的 覆盖 方法 可 能 是 想 要 扩充 而 不 是 简单 的 替代 基 类 中 的 重 名 方法 。 有 一 个 简单 的 方 

法 可 以 直接 调用 基 类 方法 : 只 要 调用 BaseClassName.methodname(self,arguments)。 有 时 这 
对 于 客户 端 也 很 有 用 。 (要 注意 只 有 BaseClassName 在 同一 全 局 作用 域 定义 或 导入 时 才能 这 
样 用 。) 


Python 有 两 个 用 于 继承 的 辑 数 : 


e 使 用 isinstance() 来 检查 实例 类 型 : isinstance(obj, int) 只 有 obj.class 是 int 或 者 是 从 int 派 生 
的 类 时 才 为 True。 

e 使 用 issubclass() 来 检查 类 的 继承 : issubclas (bool，int) 是 True 因为 bool 是 int 的 子 类 。 然 
而 ，issubclass(float,int) 为 False， 因 为 float 不 是 int 的 子 类 。 


9.5.1. 多 继承 


Python 也 支持 一 种 形式 的 多 继承 。 具 有 多 个 基 类 的 类 定义 如 下 所 示 : 


class DerivedClassName(Basei1, Base2, Base3): 
«statement -1> 


«statement -N> 


对 于 大 多 数 用 途 ， 在 最 简单 的 情况 下 ， 你 可 以 认为 继承 自 父 类 的 属性 搜索 是 从 左 到 右 的 深度 
优先 搜索 ， 不 会 在 同一 个 类 中 搜索 两 次 ， 即 使 层次 会 有 重 登 。 因 此 ， 如 果 在 
DerivedClassName 中 找 不 到 属性 ， 它 搜索 Base1， 然 后 Gži) 基 类 中 的 Base1， 如 果 没 有 
找到 ， 它 会 搜索 base2， 依 此 类 推 。 


事实 要 稍微 复杂 一 些 ; 为 了 支持 合作 调用 super()， 方 法 解析 的 顺序 会 动态 改变 。 这 种 方法 在 
某 些 其 它 多 继承 的 语言 中 也 有 并 叫做 call-next-method， 它 比 单 继承 语言 中 的 super 调 用 更 强 
大 。 


动态 调整 顺序 是 必要 的 ， 因 为 所 有 的 多 继承 都 会 有 一 个 或 多 个 菱形 关系 (从 最 底部 的 类 向 上 ， 
至 少 会 有 一 个 父 类 可 以 通过 多 条 路 径 访 问 到 ) 。 例 如 ， 所 有 的 类 都 继承 自 object， 所 以 任何 多 
继承 都 会 有 多 条 路 径 到 达 object。 为 了 防止 基 类 被 重复 访问 ， 动 态 算法 线性 化 搜索 顺序 ， 每 个 
类 都 按 从 左 到 右 的 顺序 特别 指定 了 顺序 ， 每 个 父 类 只 调用 一 次 ， 这 是 单调 的 〈 也 就 是 说 一 个 
类 被 继承 时 不 会 影响 它 祖先 的 次 序 ) 。 所 有 这 些 特 性 使 得 设计 可 靠 并 且 可 扩展 的 多 继承 类 成 
为 可 能 。 有 关 详 细 信 息 ， 请 参阅 http://www.python.org/download/releases/2.3/mro/。 


9.6. 私有 变量 


在 Python 中 不 存在 只 能 从 对 像 内 部 访问 的 “私有 "实例 变量 。 然 而 ， 有 一 项 大 多 数 Python ft 
码 都 遵循 的 公约 : 带 有 下 划 线 (BUB spam) 前 级 的 名 称 应 被 视 为 非 公 开 的 API 的 一 部 分 
(无 论 是 函数 、 方法 还 是 数据 成 员 ) 。 它 应 该 被 当做 一 个 实现 细节 ， 将 来 如 果 有 变化 恕 不 另 
行 通知 。 


因为 有 一 个 合理 的 类 私有 成 员 的 使 用 场景 ( 即 为 了 避免 名 称 与 子 类 定义 的 名 称 冲突 ) ， 
Python 对 这 种 机 制 有 简单 的 支持 ， 叫 做 name mangling, spam 形式 的 任何 标识 符 (前 面 至 少 
两 个 下 划 线 ， 后 面 至 多 一 个 下 划 线 ) 将 被 替换 为 _classnamespam，classname 是 当前 类 的 名 
字 。 此 重 整 是 做 而 不 考虑 该 标识 符 的 句法 位 置 ， 只 要 它 出 现在 类 的 定义 的 范围 内 。 


Name mangling 有 利于 子 类 重 写 父 类 的 方法 而 不 会 破坏 类 内 部 的 方法 调用 。 例 如 : 


class Mapping: 
def _ init__(self, iterable): 
self.items_list = [] 
self.__update(iterable) 


def update(self, iterable): 
for item in iterable: 
self.items_list.append(item) 


__update = update # private copy of original update() method 
class MappingSubclass(Mapping): 


def update(self, keys, values): 
# provides new signature for update() 
# but does not break __init__() 
for item in zip(keys, values): 
self.items_list.append(item) 


请 注意 mangling 规则 的 目的 主要 是 避免 发 生意 外 ; 访问 或 者 修改 私有 变量 仍然 是 可 能 的 。 这 
在 特殊 情况 下 ， 例 如 调试 的 时 候 ， 还 是 有 用 的 。 


注意 传递 给 exec 或 eval() 的 代码 没有 考虑 要 将 调用 类 的 类 名 当 作 当前 类 ; 这 类 似 于 global 语 名 
的 效果 ， 影 响 只 限于 一 起 进行 字 节 编译 的 代码 。 相 同 的 限制 适用 于 getattr()、 setattr() 和 
delattr()， 以 及 直接 引用 dict 时 。 


9.7. 雪人 三 的 说 明 


有 时 候 类 似 于 Pascal 的 "record" 或 C 的 "struct" 的 数据 类 型 很 有 用 ， 它 们 把 几 个 已 命名 的 数据 
项 目 绑 定 在 一 起 。 一 个 空 的 类 定义 可 以 很 好 地 做 到 : 


class Employee: 
pass 


john = Employee() # Create an empty employee record 


# Fill the fields of the record 
john.name = 'John Doe' 
john.dept = ‘computer lab' 
john.salary = 1000 


i — FR Python 代码 需要 一 个 特殊 的 抽象 数据 结构 的 话 ， 通 常 可 以 传人 一 个 类 来 模拟 该 数据 类 
型 的 方法 。 例 如 ， 如 果 你 有 一 个 用 于 从 文件 对 象 中 格式 化 数据 的 画 数 ， 你 可 以 定义 一 个 带 有 

read () 和 readline () 方法 的 类 ， 以 此 从 字符 串 缓 冲 读 取 数 据 ， 然 后 将 该 类 的 对 象 作 为 参数 传人 
AU sh BATES 2T 


实例 的 方法 对 象 也 有 属性 : mse tR HEMOR Bst £8, mfunce AIAN HRB xt RK, 


9.8. Fhe X 
用 户 定义 的 异常 类 也 由 类 标识 。 利 用 这 个 机 制 可 以 创建 可 扩展 的 异常 层次 。 
raise 语 句 有 两 种 新 的 有 效 的 (语义 上 的 ) 形式 : 


raise Class 


raise Instance 


第 一 种 形式 中 ，Class 必须 是 type 或 者 它 的 子 类 的 一 个 实例 。 第 一 种 形式 是 一 种 简写 : 


raise Class() 


except 子 句 中 的 类 如 果 和 与 异常 是 同一 个 类 或 者 是 其 基 类 ， 那 么 它们 就 是 相 容 的 (但 是 反 过 来 
是 不 行 的 一 一 except 子 句 列 出 的 子 类 与 基 类 是 不 相 容 的 ) 。 例 如 ， 下 面 的 代码 将 按 该 顺序 打 
HMB C, D: 


class B(Exception): 
pass 

class C(B): 
pass 

class D(C): 
pass 


for cls in [B, C, D]: 
try: 
raise cls() 
except D: 
print("D") 
except C: 
print("C") 
except B: 
print("B") 


请 注意 ， 如 果 except 子 句 的 顺序 倒 过 来 (excpetB 在 最 前 面 ) ， 它 就 会 打印 B，B，B 一 一 第 
一 个 匹配 的 异常 被 触发 。 


打印 一 个 异常 类 的 错误 信息 时 ， 先 打印 类 名 ， 然 后 是 一 个 空格 、 一 个 冒号 ， 然 后 是 用 内 置 函 
数 str() 将 类 转换 得 到 的 完整 字符 串 。 


9.9. 3X (V za 


PUTER RI BEE SEAS A dao RAB LAA fonda 75 : 


for 


for 


for 


for 


for 


这 种 访问 风格 清晰 、 


element in [1, 2, 3]: 

print (element ) 

element in (1, 2, 3): 

print (element ) 

key in {'one':1, 'two':2}: 
print(key) 

char in "123": 

print(char) 

line in open("myfile.txt"): 
print(line, end='') 


简洁 又 方便 。 和 迭代 器 的 用 法 在 Python 中 普通 而 且 统 一 。 在 后 台 ， ford 


句 调 用 容器 对 象 上 的 iter() 。 该 画 数 返 回 一 个 定义 了 next() 方 法 的 迭代 器 对 象 ， 它 在 容器 中 逐 


一 访问 元 素 。 没 有 后 续 的 元 素 时 ，next() 会 引发 Stoplteration 
是 用 内 建 的 next() 函 数 调 用 next() 方 法 ; 此 示例 显示 它 是 如 何 工作 : 


>>> 


>>> 


>>> 


s = 'abc' 
it - iter(s) 
it 


<iterator object at OxO0O0A1DB50» 


>>> 
‘ag! 

>>> 
‘bh! 


>>> 


next(it) 


next(it) 


next(it) 


next(it) 


Traceback (most recent call last): 
File "<stdin>", line 1, in ? 


next(it) 


StopIteration 


Sma 4 


FF, 


r3 


诉 for 循 环 终止 。 你 可 以 


看 过 和 迭代 器 协议 背后 的 机 制 后 ， 将 很 容易 将 迭代 器 的 行为 添加 到 你 的 类 中 。 定 义 一 个 iter() 方 
法 ， 它 使 用 next() 方 法 返回 一 个 对 象 。 如 果 类 定义 了 next()，iter() 可 以 只 返回 self : 


class Reverse: 

"""Iterator for looping over a sequence backwards.""" 

def | init (self, data): 
self.data - data 
self.index - len(data) 

def — iter (self): 
return self 

def _ next (self): 
if self.index -- 0: 

raise StopIteration 

self.index - self.index - 1 
return self.data[self.index] 


>>> rev = Reverse('spam' ) 

>>> iter(rev) 

<__main__.Reverse object at 0x00A1DB50» 
>>> for char in rev: 


print(char) 


0o mp 3s - 


9.10. 生成 器 


生成 器 是 简单 且 功 能 强大 的 工具 ， 用 于 创建 迭代 器 。 它 们 写 起 来 就 像 是 正规 的 男 数 ， 需 要 返 
回 数据 的 时 候 使 用 yield 语 句 。 每 次 在 它 上 面 调用 next() 时 ， 生 成 器 恢复 它 脱离 的 位 置 〈 它 记忆 
语句 最 后 一 次 执行 的 位 置 和 所 有 的 数据 值 ) 。 以 下 示例 演示 了 生成 器 可 以 非常 简单 地 创建 出 
来 : 


def reverse(data): 
for index in range(len(data)-1, -1, -1): 
yield data[index] 


>>> for char in reverse('golf'): 
print(char) 


Qe ora: 


生成 器 能 做 到 的 什么 事 ， 前 一 节 所 述 的 基于 类 的 迭代 器 也 能 做 到 。 生 成 器 这 么 简洁 是 因 
为 iter() 和 next() 方 法 是 自动 创建 的 。 


另 一 个 关键 特征 是 在 调用 中 本 地 变量 和 执行 状态 会 自动 保存 ， 这 使 得 该 琅 数 更 容易 写 ， 也 上 比 
使 用 实例 变量 的 方法 ， 如 self.index 和 self.data 更 清晰 。 


除了 自动 创建 方法 和 保存 程序 的 状态 ， 当 生成 器 终止 时 ， 它 们 会 自动 引发 Stoplteration。 在 组 
合 中 ， 这 些 功 能 可 以 容易 地 创建 运 代 器 而 不 需要 写 正 则 本 数 


9.11. 生成 器 表达 式 


一 些 简单 的 生成 器 可 以 简洁 地 使 用 表达 式 ， 语 法 类 似 于 列表 格式 ， 但 用 圆 括号 () 而 不 是 方 括号 
[]。 这 些 表 达 式 用 于 闭 包 本 数 马上 使 用 生成 器 的 情况 。 生 成 器 表达 式 更 紧凑 但 比 完整 生成 器 定 
义 较 不 通用 ， 倾 向 于 更 多 的 内 存 友好 比 等 效 列 表 中 体会 


例子 


>>> sum(i*i for i in range(10)) # sum of squares 
285 


>>> xvec = [10, 20, 30] 

>>> yvec = [7, 5, 3] 

>>> sum(x*y for x,y in zip(xvec, yvec)) # dot product 
260 


>>> from math import pi, sin 
>>> sine_table = {x: sin(x*pi/180) for x in range(0, 91)} 


>>> unique_words = set(word for line in page for word in line.split()) 
>>> valedictorian = max((student.gpa, student.name) for student in graduates) 


>>> data = 'golf' 
>>> list(data[i] for i in range(len(data)-1, -1, -1)) 
[eesti a RE rons 'g'] 


脚注 


| [1] | Except for one thing. Module objects have a secret read-only attribute called dict 
which returns the dictionary used to implement the module's namespace; the name dict is 
an attribute but not a global name. Obviously, using this violates the abstraction of 
namespace implementation, and should be restricted to things like post-mortem debuggers. 


10. 标准 库 概 览 
10.1. 操作 系统 接口 


os 模块 提供 了 几 十 个 画 数 与 操作 系统 交互 : 


>>> import os 

>>> os.getcwd() # Return the current working directory 

"C:\\Python34' 

>>> os.chdir('/server/accesslogs' ) # Change current working directory 
>>> os.system('mkdir today') # Run the command mkdir in the system shell 
0 


— 5E £ fii FHimportosBSJE xX mm 4s Afromosimport*, ix Sib? f0s.open() BAKA E hopen) A 
数 ， 它 们 的 功能 完全 不 同 。 


内 置 的 dir() 和 help() 画 数 对 于 使 用 像 0os 大 型 模块 可 以 作为 非常 有 用 的 交互 式 帮助 : 


>>> import os 

>>> dir(os) 

<returns a list of all module functions> 

>>> help(os) 

<returns an extensive manual page created from the module's docstrings> 


对 于 日 常 的 文件 和 目录 管理 任务 ，shutil 模 块 提供 了 一 个 易于 使 用 的 高 级 接口 : 


>>> import shutil 

>>> shutil.copyfile('data.db', 'archive.db') 
'archive.db' 

>>> shutil.move('/build/executables', 'installdir') 
'installdir' 


10.2. 文件 通配符 


glob 模 块 提供 了 一 个 函数 用 于 在 目录 中 以 通配符 搜索 文件 ， 并 生成 匹配 的 文件 列表 : 


>>> import glob 
>>> glob.glob('*.py') 
['primes.py', 'random.py', 'quote.py'] 


NS 


10.3. 命令 行 参数 


常见 的 实用 程序 脚本 通常 需要 人 处理 命 合 行 参数 。 这 些 参数 以 一 个 列表 存储 在 sys 模 块 的 argv 属 
性 中 。 例 如 下 面 的 输出 结果 来 自 于 从 命 兮 


z 
f1i& fTpythondemo.pyone two three : 
>>> import sys 


>>> print(sys.argv) 
['demo.py', 'one', 'two', 'three'] 


getopt 模 块 使 用 Unix getopt()ES 285 27 = 438 sys.argv, argparse A fe Rez, 更 灵活 的 
$54517 43D BE. 


10.4. 错误 输出 重 定 向 和 程序 终 


sys 模 块 还 具有 stdin、stdout 和 和 stderr 属 性 。 即 使 在 stdout 被 重 定 向 时 ， 后 者 也 可 以 用 于 显示 警 
告 和 错误 信息 : 


>>> sys.stderr.write('Warning, log file not found starting a new one\n') 
Warning, log file not found starting a new one 


终止 脚本 最 直接 的 方法 来 是 使 用 sys.exit()。 


10.5. 字符 串 模 式 匹配 


re 模块 为 高 级 的 字符 串 处 理 提供 了 正则 表达 式 工 具 。 对 于 复杂 的 匹配 和 操作 ， 正 则 表达 式 提供 
了 简洁 、 优 化 的 解决 方案 : 


>>> Import re 

>>> re.findall(r'Nbf[a-z]*', 'which foot or hand fell fastest') 
['foot', 'fell', 'fastest'] 

>>> re.sub(r'(Nb[a-z]*) \1', r'\1', 'cat in the the hat!) 

'cat in the hat' 


当 只 需要 简单 的 功能 时 ， 最 好 使 用 字符 串 方 法 ， 因 为 它们 更 容易 阅读 和 调试 : 


>>> 'tea for too'.replace('too', 'two') 
'tea for two' 


10.6. 效 学 


math 模 块 为 浮 点 运算 提供 了 对 底层 C 画 数 库 的 访问 : 


>>> import math 

>>> math.cos(math.pi / 4.0) 
0.70710678118654757 

>>> math.log(1024, 2) 

10.0 


random 模 块 提供 了 进行 随机 选择 的 工具 : 


>>> import random 

>>> random.choice(['apple', 'pear', 'banana']) 

'apple' 

>>> random.sample(range(100), 10) # sampling without replacement 
[30, 83, 16, 4, 8, 81, 41, 50, 18, 33] 


>>> random.random() # random float 

0.17970987693706186 

>>> random.randrange(6) # random integer chosen from range(6) 
4 


SciPy 项 目 [http://scipy.org](http://scipy.org) 有 很 多 其 它 用 于 数值 计算 的 模块 。 


10.7. 互联 网 访问 


有 很 多 的 模块 用 于 访问 互联 网 和 处 理 的 互联 网 协议 。 最 简单 的 两 个 是 从 URL 获 取 数 据 的 
urllib.request 和 发 送 邮 件 的 smtplib : 


>>> from urllib.request import urlopen 
>>> for line in urlopen('http://tycho.usno.navy.mil/cgi-bin/timer.pl'): 
line = line.decode('utf-8') # Decoding the binary data to text. 
if 'EST' in line or 'EDT' in line: # look for Eastern Time 
print(line) 


<BR>Nov. 25, 09:43:32 PM EST 


>>> import smtplib 
>>> server = smtplib.SMTP('localhost') 
>>> server.sendmail('soothsayerQexample.org', 'jcaesar@example.org', 
"""To: jcaesarQexample.org 
. From: soothsayer@example.org 


. Beware the Ides of March. 


n" Miu) 


>>> server.quit() 
(请 注意 第 二 个 示例 需要 在 本 地 主机 上 运行 邮件 服务 器 ) 。 


10.8. 日 期 和 时 间 


datetime de £t T RBA HAN ADA, PAR SND ERAS ANTE. MAMAN i 
算法 的 同时 ， 实 现 的 重点 放 在 更 有 效 的 处 理 和 格式 化 输出 。 该 模块 还 支持 处 理 时 区 。 


>>> # dates are easily constructed and formatted 

>>> from datetime import date 

>>> now = date.today() 

>>> now 

datetime.date(2003, 12, 2) 

>>> now.strftime("%m-%d-%y. %d %b %Y is a 96A on the %d day of %B.") 
"12-02-03. 02 Dec 2003 is a Tuesday on the 02 day of December. ' 


>>> # dates support calendar arithmetic 
>>> birthday = date(1964, 7, 31) 

>>> age = now - birthday 

>>> age.days 

14368 


10.9. 数据 压缩 
常见 的 数据 打包 和 压缩 格式 有 模块 直接 支持 ， 包 括 : zlib, gzip, bz2, lzma, zipfile 和 tarfile。 


>>> import zlib 
>>> s = b'witch which has which witches wrist watch' 
>>> len(s) 


>>> t = zlib.compress(s) 

>>> len(t) 

37 

>>> zlib.decompress(t) 

b'witch which has which witches wrist watch' 
>>> zlib.crc32(s) 

226805979 


10.10. 性 能 度量 


一 些 Python 用 户 对 同一 问题 的 不 同 解决 方法 之 间 的 性 能 差异 深 有 兴趣 。Python 提供 了 的 一 
个 度量 工具 可 以 立即 解决 这 些 问 题 。 


例如 ， 使 用 元 组 封装 和 拆 封 功能 而 不 是 传统 的 方法 来 交换 参数 可 能 会 更 吸引 人 。timeit 模 块 快 
速 证 明了 现代 的 方法 更 快 一 些 : 


>>> from timeit import Timer 

>>> Timer('t=a; a=b; b=t', 'a=1; b=2').timeit() 
0.57535828626024577 

>>> Timer('a,b = b,a', 'a=1; b=2').timeit() 
0.54962537085770791 


与 timeit 的 精细 的 粒度 相反 ，profile 和 pstats 模 块 提供 了 针对 更 大 代码 块 的 时 间 度 量 工具 。 


10.11. 质量 控制 


开发 高 质量 软件 的 方法 之 一 是 为 每 一 个 画 数 开发 测试 代码 ， 并 且 在 开发 过 程 中 经 常 进行 测 
To 

doctest 模 块 提供 一 个 工具 ， 扫 描 模 块 并 根据 程序 A e 测试 构造 如 
同 简单 的 将 它 的 输出 结果 剪 切 并 粘贴 到 文档 字符 串 中 。 通 过 用 户 提供 的 例子 ， 它 发 展 了 文 
档 ， 人 允许 doctest 模块 确认 代码 的 结果 是 否 与 文档 一 


def average(values): 
"""Computes the arithmetic mean of a list of numbers. 


>>> print(average([20, 30, 70])) 
40.0 


return sum(values) / len(values) 


import doctest 
doctest.testmod() # automatically validate the embedded tests 


unittest 模 块 不 像 doctest 模 块 那样 容易 ， 不 过 它 可 以 在 一 个 独立 的 文件 里 提供 一 个 更 全 面 的 测 
RE: 


import unittest 


class TestStatisticalFunctions(unittest.TestCase): 


def test_average(self): 
self .assertEqual(average([20, 30, 70]), 40.0) 
self .assertEqual(round(average([1, 5, 7]), 1), 4.3) 
with self.assertRaises(ZeroDivisionError): 
average([]) 
with self.assertRaises(TypeError): 
average(20, 30, 70) 


unittest.main() # Calling from the command line invokes all tests 


10.12. Batteries Included 


Python "Batteries Included" 的 哲学 。 这 最 好 是 通过 其 较 大 的 文件 包 的 先进 和 强大 功能 。 例 
如 : 
e xmlrpc.client 和 xmlrpc.server 模 块 让 远程 过 程 调用 变 得 轻而易举 。 尽 管 模块 有 这 样 的 名 


字 ， 它 不 需要 直接 XML 知识 或 义理 XML 。 


。 email 包 是 是 一 个 处 理 电 子 邮 件 的 库 ， 包 括 MIME 和 其 它 基 于 RFC 2822 的 邮件 。 与 smtplib 
和 poplib 用 于 实际 发 送 和 接收 邮件 ，email 包 有 一 个 完整 的 工具 集 用 于 构建 或 者 解码 复杂 
邮件 结构 《包括 附件 ) ， 并 实现 互联 网 编码 和 头 协议 。 

e xml.dom 和 xml.sax 的 包 为 这 种 流行 的 数据 交换 格式 提供 了 强大 的 支持 。 同 样 ，csv 模 块 支 
持 以 常见 的 数据 库 格 式 直 接 读 取 和 写 入 。 这 些 模块 和 包 一 起 大 大 简化 了 Python 应 用 程序 
和 其 他 工具 之 间 的 数据 交换 。 

e 国际 化 支持 模块 包括 gettext、locale 和 codecs 包 。 


11. 标准 库 概 览 一 第 lI 部 分 


第 二 部 分 提供 了 更 高 级 的 模块 用 来 支持 专业 编程 的 需要 。 这 些 模块 很 少 出 现在 小 型 的 脚本 
里 。 


11.1. 输出 格式 
reprlib 模 块 提 供 一 个 定制 版 的 repr() 用 于 显示 大 型 或 者 深层 馈 套 容器 : 


>>> import reprlib 
>>> reprlib.repr(set('supercalifragilisticexpialidocious' )) 
"set(['‘a', 5o Hole te ups TOE y aa.) aye 


pprint 模 块 提供 更 复杂 的 打印 控制 ， 以 解释 器 可 读 的 方式 打印 出 内 置 对 象 和 用 户 定义 的 对 象 。 
当 结 果 超过 一 行 时 ， 这 个 "漂亮 的 打印 机 "将 添加 分 行 符 和 缩 进 ， 以 更 清楚 地 显示 数据 结构 : 


>>> import pprint 
>>> t = [[[['black', 'cyan'], 'white', ['green', 'red']], [['magenta', 
'yellow'], 'blue']]] 


>>> pprint.pprint(t, width=30) 
[L[E['black', 'cyan'], 
'white', 
['green', 'red']], 
[['magenta', 'yellow'], 
'blue']]] 


textwrap 模 块 格式 化 文本 段落 以 适应 设 定 的 屏 宽 : 


>>> Import textwrap 

>>> doc = """The wrap() method is just like fill() except that it returns 
. a list of strings instead of one big string with newlines to separate 
. the wrapped lines.""" 


>>> print(textwrap.fill(doc, width=40) ) 
The wrap() method is just like fill() 
except that it returns a list of strings 
instead of one big string with newlines 
to separate the wrapped lines. 


locale 模 块 会 访问 区 域 性 特定 数据 格式 的 数据 库 。 分 组 属性 的 区 域 设 置 的 格式 函数 的 格式 设置 
的 数字 以 直接 的 方式 提供 了 组 分 隔 符 : 


>>> import locale 

>>> locale.setlocale(locale.LC_ALL, 'English_United States.1252') 
"English_United States.1252' 

>>> conv = locale.localeconv() # get a mapping of conventions 
>>> X = 1234567.8 

>>> locale.format("%d", x, grouping=True) 

'1,234,567' 

>>> locale.format_string("%s%.*f", (conv['currency symbol'], 

um conv['frac digits'], x), grouping-True) 
'$1,234, 567.80" 


11.2. 模板 


string 模 块 包括 一 个 通用 Template 类 ， 它 用 简化 的 语法 适合 最 终 用 户 编辑 。 这 人 允许 用 户 自 定义 
他 们 的 应 用 程序 无 需 修改 应 用 程序 。 


这 种 格式 使 用 的 占 位 符 名 称 由 $ 与 有 效 的 Python 标识 符 (字母 数字 字符 和 下 划 线 ) 组 成 。 周 
围 的 大 括号 与 占 位 符 人 允许 它 应 遵循 的 更 多 字母 数字 字母 并 且 中 间 没 有 空格 。$$ 创 建 一 个 转 义 
的 $ : 


>>> from string import Template 

>>> t = Template('${village}folk send $$10 to $cause.') 

>>> t.substitute(village-'Nottingham', cause='the ditch fund') 
'Nottinghamfolk send $10 to the ditch fund.' 


当 字 典 或 关键 字 参 数 中 没有 提供 占 位 符 时 ，substitute() 方 法 将 引发 KeyError。 对 于 邮件 -合并 
风格 的 应 用 程序 ， 用 户 提供 的 数据 可 能 不 完整 ， 这 时 safe_substitute() 方 法 可 能 会 更 合适 一 一 
如 果 没 有 数据 它 将 保持 占 位 符 不 变 : 


>>> t = Template('Return the $item to $owner.') 
>>> d = dict(item='unladen swallow' ) 

>>> t.substitute(d) 

Traceback (most recent call last): 


KeyError: 'owner' 
>>> t.safe_substitute(d) 


"Return the unladen swallow to $owner.' 


Template 类 的 子 类 可 以 指定 自 定义 的 分 隔 符 。 例 如 ， 图 像 浏览 器 的 批量 命名 工具 可 能 选用 百 
分 号 作为 表示 当前 日 期 、 图 像 序列 号 或 文件 格式 的 占 位 符 : 


>>> import time, os.path 
>>> photofiles = ['img 1074.jpg', 'img 1076.jpg', 'img 1077.jpg'] 
>>> class BatchRename(Template): 
delimiter = '%' 
>>> fmt = input('Enter rename style (%d-date %n-seqnum %f-format): ') 
Enter rename style (%d-date %n-seqnum %f-format): Ashley_%n%f 


>>> t = BatchRename( fmt) 

>>> date = time.strftime( '%d%b%y ' ) 

>>> for i, filename in enumerate(photofiles): 
base, ext - os.path.splitext(filename) 
newname = t.substitute(d-date, n-i, f=ext) 
print('{0} --> {1}'.format(filename, newname)) 


img_1074.jpg --> Ashley 0.jpg 
img_1076.jpg --> Ashley_1.jpg 
img_1077.jpg --> Ashley_2.jpg 


模板 的 另 一 个 应 用 是 把 多 样 的 输出 格式 细节 从 程序 逻辑 中 分 类 出 来 。 这 使 它 能 够 替代 用 户 的 
XML 文件 、 纯 文 本 报告 和 HTML 网 页 报表 。 


11.3. 二 进 制 数据 记录 格式 


The struct module provides pack() and unpack() functions for working with variable length 
binary record formats. The following example shows how to loop through header information 
in a ZIP file without using the zipfile module. Pack codes "H" and "I" represent two and four 
byte unsigned numbers respectively. The "<" indicates that they are standard size and in 
little-endian byte order: 


import struct 


with open('myfile.zip', 'rb') as f: 
data = f.read() 


start - 0 

for i in range(3): 4 show the first 3 file headers 
start += 14 
fields = struct.unpack('«IIIHH', data[start:start+16]) 
crc32, comp size, uncomp size, filenamesize, extra size = fields 


start *- 16 

filename = data[start:start+filenamesize] 

start += filenamesize 

extra = data[start:start+extra_size] 
print(filename, hex(crc32), comp_size, uncomp_size) 


start += extra_size + comp_size # skip to the next header 


11.4. 多 线程 


线程 是 一 种 解 耦 非 顺序 依赖 任务 的 技术 。 线 程 可 以 用 来 提高 接应 用 程序 受用 户 输入 的 响应 速 
度 ， 而 其 他 任务 同时 在 后 台 运 行 。 一 个 相关 的 使 用 场景 是 VO 操作 与 另 一 个 线程 中 的 计算 并 行 
执行 。 


下 面 的 代码 演示 在 主 程序 连续 运行 的 同时 ，threading 模 块 如 何在 后 台 运 行 任务 : 


import threading, zipfile 


class AsyncZip( threading. Thread): 

def | init (self, infile, outfile): 
threading.Thread. init (self) 
self.infile - infile 
self.outfile - outfile 

def run(self): 
f - zipfile.ZipFile(self.outfile, 'w', zipfile.ZIP DEFLATED) 
f.write(self.infile) 
f.close() 
print('Finished background zip of:', self.infile) 


background - AsyncZip('mydata.txt', 'myarchive.zip') 
background.start() 
print('The main program continues to run in foreground.') 


background. join() # Wait for the background task to finish 
print('Main program waited until background was done.') 


多 线程 应 用 程序 的 最 主要 挑战 是 协调 线程 间 共 享 的 数据 或 其 他 资源 。 为 此 目的 ， 该 线程 模块 
提供 了 许多 同步 原 语 包括 锁 、 事件 、 条 件 变量 和 信号 量 。 


尽管 这 些 工具 很 强大 ， 很 小 的 设计 错误 也 可 能 导致 很 难 复 现 的 问题 。 因 此 ， 任 务 协调 的 首选 
方法 是 把 对 一 个 资源 的 所 有 访问 集中 在 一 个 单独 的 线程 中 ， 然 后 使 用 queue 模 块 用 那个 线程 服 
务 其 他 线程 的 请 求 。 应 用 程序 使 用 Queue 对 象 进行 线程 间 的 通信 和 协调 将 更 容易 设计 、 BS 
可 读 性 和 更 可 靠 。 


11.5. 日 志 


logging 模 块 提供 了 一 个 具有 完整 功能 并 且 非 常 受 活 的 日 志 系统 。 最 简单 的 ， 发 送 消息 到 一 个 
文件 或 者 sys.stderr : 


import logging 

logging.debug('Debugging information' ) 

logging.info('Informational message' ) 
logging.warning('Warning:config file %s not found', 'server.conf') 
logging.error('Error occurred') 

logging.critical('Critical error -- shutting down') 


这 将 生成 以 下 输出 : 


WARNING: root:Warning:config file server.conf not found 
ERROR: root:Error occurred 
CRITICAL: root:Critical error -- shutting down 


默认 情况 下 ， 信 息 和 调试 消息 被 压制 并 输出 到 标准 错误 。 其 他 输出 选项 包括 将 消息 通过 
email, datagrams、sockets 发 送 ， 或 者 发 送 到 HTTP 服务 器 。 根 据 消息 的 优先 级 ， 新 的 过 滤 
器 可 以 选择 不 同 的 方式 : DEBUG、INFO、WARNING、ERROR 和 CRITICAL。 


日 志 系统 可 以 直接 在 Python 代码 中 定制 ， 也 可 以 不 经 过 应 用 程序 直接 在 一 个 用 户 可 编辑 的 配 
置 文件 中 加 载 。 


11.6. 8551 FH 


Python 会 自动 进行 内 存 管 理 (对 大 多 数 的 对 象 进行 引用 计数 和 垃圾 回收 以 循环 利用 ) 。 在 最 
后 一 个 引用 消失 后 ， 内 存 会 立即 释放 。 


这 个 方式 对 大 多 数 应 用 程序 工作 良好 ， 但 是 有 时 候 会 需要 跟踪 对 象 ， 只 要 它们 还 被 其 它 地 方 
所 使 用 。 不 幸 的 是 ， 只 是 跟踪 它们 也 会 创建 一 个 引用 ， 这 将 使 它们 永久 保留 。weakref 模 块 提 
供 工 具 用 来 无 需 创建 一 个 引用 跟踪 对 象 。 当 不 再 需要 该 对 象 时 ， 它 会 自动 从 weakref RF m 
除 并 且 会 为 weakref 对 象 触发 一 个 回调 。 典 型 的 应 用 包括 缓存 创建 的 时 候 需要 很 大 开销 的 对 
象 : 


>>> import weakref, gc 
>>> class A: 
def _ init (self, value): 
self.value - value 
def _ repr (self): 
return str(self.value) 


>>> a = A(10) # create a reference 

>>> d = weakref .WeakValueDictionary() 

>>> d['primary'] =a # does not create a reference 

>>> d['primary'] # fetch the object if it is still alive 
10 

>>> dela # remove the one reference 

>>> gc.collect() # run garbage collection right away 

0 

>>> d['primary'] # entry was automatically removed 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
d['primary'] # entry was automatically removed 
File "C:/python34/lib/weakref.py", line 46, in  getitem _ 
o = self.data[key]() 
KeyError: 'primary' 


11.7. 列表 工具 


很 多 数据 结构 使 用 内 置 列表 类 型 就 可 以 满足 需求 。 然 而 ， 有 时 需要 其 它 具有 不 同性 能 的 蔡 代 


The array module provides an array() object that is like a list that stores only homogeneous 
data and stores it more compactly. The following example shows an array of numbers stored 
as two byte unsigned binary numbers (typecode "H") rather than the usual 16 bytes per 
entry for regular lists of Python int objects: 


>>> from array import array 

>>> a = array('H', [4000, 10, 700, 22222]) 
>>> sum(a) 

26932 

>>> a[1:3] 

array('H', [10, 700]) 


collections 模 块 提供 了 一 个 deque() 对 象 ， 就 像 一 个 列表 ,不 过 它 从 左边 添加 和 弹出 更 快 ， 但 是 
在 内 部 查询 更 慢 。 这 些 对 象 非常 实现 队列 和 广度 优先 的 树 搜索 : 


>>> from collections import deque 

>>> d = deque(["taski", "task2", "task3"]) 
>>> d.append("task4") 

>>> print("Handling", d.popleft()) 
Handling task1 


unsearched = deque([starting_node] ) 
def breadth first search(unsearched): 
node = unsearched.popleft() 
for m in gen moves(node): 
if is goal(m): 
return m 
unsearched.append(m) 


除了 列表 的 替代 实现 ， 该 库 还 提供 了 其 它 工 具 例 如 bisecit 模 块 中 包含 处 理 排 好 序 的 列表 的 画 
Bl: 


>>> import bisect 

>>> scores = [(100, 'perl'), (200, 'tcl'), (400, 'lua'), (500, 'python')] 
>>> bisect.insort(scores, (300, 'ruby')) 

>>> scores 

[(100, 'perl'), (200, 'tcl'), (300, 'ruby'), (400, 'lua'), (500, 'python')] 


heapqf& + tE kh bad uml Mi oU 最 小 的 值 总 是 保持 在 第 需 个 位 置 。 这 对 循 
环 访 问 最 小 元 素 ， 但 是 不 想 运 行 完整 列表 排序 的 应 用 非常 有 用 : 


>>> from heapq import heapify, heappop, heappush 

>>> data = [1, 3, 5, 7, 9, 2, 4, 6, 8, 9] 

>>> heapify(data) # rearrange the list into heap order 
>>> heappush(data, -5) # add a new entry 

>>> [heappop(data) for i in range(3)] # fetch the three smallest entries 
[-5, 0, 1] 


11.8. 十 进 制 浮 点 数 运算 


decimal 模 块 提供 一 个 Decimal 数 据 类 型 用 于 为 十 进 制 浮 点 运算 。 相 上 比 二 进 制 浮 点 数 内 置 的 
float 实 现 ， 这 个 类 对 于 以 下 情形 特别 有 用 : 


财务 应 用 程序 和 其 他 用 途 ， 需 要 精确 的 十 进 制 表示 形式 ， 
控制 精度 ， 

对 符合 法 律 或 法 规 要 求 ， 舍 入 的 控制 

跟踪 有 效 小 数位 

用 户 希 望 计算 结果 与 手工 计算 相符 的 应 用 程序 。 


例如 ， 计 算 上 70% 电 话费 的 5% 税 给 不 同 的 十 进 制 浮 点 和 二 进 制 浮 点 结果 。 区 别 变 得 明显 如 
果 结 果 舍 入 到 最 接近 的 分 : 


>>> from decimal import * 

>>> round(Decimal('0.70') * Decimal('1.05'), 2) 
Decimal('0.74') 

>>> round(.70 * 1.05, 2) 

0.73 


Decimal 的 结果 总 是 保有 结尾 的 0， 自 动 从 两 位 精度 延伸 到 4 位 。Decimal 类 似 手 工 完成 的 数学 
运算 ， 这 就 避免 了 二 进 制 浮 点 数 无 法 精确 表达 数据 精度 产生 的 问题 。 


精确 地 表示 允许 Decimal 可 以 执行 二 进 制 浮 点 数 无 法 进行 的 模 运 算 和 等 值 测 试 : 


>>> Decimal('1.00') % Decimal('.10') 
Decimal('0.00') 

>>> 1.00 % 0.10 

0.09999999999999995 


>>> sum([Decimal('0.1')]*10) == Decimal('1.0') 
True 

>>> sum([0.1]*10) == 1.0 

False 


decimal 模 块 提供 任意 精度 的 运算 : 


>>> getcontext().prec = 36 
>>> Decimal(1) / Decimal(7) 
Decimal ('0@.142857142857142857142857142857142857 ' ) 


12. 现 在 怎么 办 ? 


阅读 本 教程 可 能 让 你 对 使 用 Python 更 感 兴趣 了 
问题 。 你 应 该 到 哪里 去 了 解 更 多 Python 的 内 容 呢 ? 


你 应 该 会 渴望 将 Python 应 用 于 解决 实际 





本 教程 是 Python 文档 集 的 一 部 分 。 文 档 集 中 的 一 些 其 它 文件 有 : 
e Python 标准 库 : 


你 应 该 浏览 本 手册 ， 它 给 出 了 标准 库 中 关于 类 型 、 本 数 和 模块 的 完整 〈《 虽 然 简 洁 ) 的 参考 资 
料 。 标 准 的 Python 发 布 包含 大 量 的 附加 模块 。 其 中 有 读 取 Unix 邮箱 、 收 取 HTTP 文档 、 生 
成 随机 数 、 解 析 命令 行 选 项 、 编 写 CGI 程序 、 压 缩 数 据 以 及 很 多 其 它 任 务 的 模块 。 浏 览 一 下 
这 个 库 参 考 手册 会 让 你 知道 有 什么 是 现成 可 用 的 。 


e 安装 Python 模块 解释 如 何 安装 由 其 他 Python 用 户 编写 的 外 部 模块 。 


e Python 语言 参考 : 详细 地 讲述 了 Python 的 语法 和 语义 。 它 读 起 来 很 难 ， 但 是 作为 语言 
本 身 的 完整 指南 非常 有 用 。 


更 多 的 Python 资源 : 


e http://www.python.org : 主要 的 Python Web 站 点 。 它 包含 代码 、 文 档 和 网 上 Python 相 
关 页 面 的 链接 。 该 网 站 在 世界 各 地 都 有 镜像 ， 如 欧洲 、 日 本 和 澳大利亚 ; 镜像 可 能 会 比 
主 站 快 ， 这 取决 于 你 的 地 理 位 置 。 

e http://docs.python.org : 快速 访问 Python 的 文档 。 

e http://pypi.python.org: Python 包 素 引 ， 以 前 的 绰号 叫 奶 酷 店 ， 是 用 户 创 建 的 Python 模 
块 的 索引 ， 这 些 模块 可 供 下 载 。 一 旦 你 开始 发 布 代码 ， 你 可 以 在 这 里 注册 你 的 代码 这 样 
其 他 人 可 以 找到 它 。 

e http://aspn.activestate.com/ASPN/Python/Cookbook/: 这 本 Python 食谱 收集 了 相当 多 的 
代码 示例 、 大 型 的 模块 ， 以 及 有 用 的 脚本 。 其 中 尤其 显著 的 贡献 被 收集 成 一 书 ， 这 本 书 
也 叫做 Python Cookbook (O'Reilly & Associates, ISBN 0-596-00797-3)。 

e http://scipy.org : The Scientific Python 项 目 包 括 数组 快速 计算 和 义理 模块 ， 和 大 量 线性 
代数 、 傅 里 叶 变 换 、 非 线性 solvers、 随 机 数 分 布 ， 统 计 分 析 以 及 类 似 的 包 。 


Python 相关 的 问题 和 问题 报告 ， 你 可 以 发 布 到 新 闻 组 comp.lang.python， 或 将 它们 发 送 到 邮 
件 列 表 python-list@python. 组 织 结 构图 。 新 闻 组 和 邮件 列表 是 互通 的 ， 因 此 发 布 到 其 中 的 一 个 
消息 将 自动 转发 给 另外 一 个 。 一 天 大 约 有 120 个 帖子 (最 高 峰 到 好 几 百 )， 包 括 询问 (AG 
答 ) 问题 ， 建 议 新 的 功能 和 宣布 新 的 模块 。 在 发 帖 之 前 ， 一 定 要 检查 常见 问题 (也 称 为 
FAQ) 的 列表 。 可 在 http://mail.python.org/pipermail/ 查 看 邮件 列表 的 为 档 。FAQ 回答 了 很 多 
经 常 出 现 的 问题 ， 可 能 已 经 包含 你 的 问题 的 解决 方法 。 


13. 交互 式 输 入 的 编辑 和 历史 记录 


某 些 版 本 的 Python 解释 器 支持 编辑 当前 的 输入 行 和 历史 记录 ， 类 似 于 在 Korn shell 和 GNU 
Bash shell 中 看 到 的 功能 。 这 是 使 用 GNU Readline 库 实现 的 ， 它 支持 各 种 编辑 风格 。 这 个 库 
有 它 自己 的 文档 ， 在 这 里 我 们 不 就 重复 了 。 


13.1. Tab 补 全 和 历史 记录 


变量 和 模块 名 的 补 全 在 解释 器 启动 时 自动 打开 以 便 Tab 键 调用 补 全 功能 ; 它 会 查看 Python 语 句 
的 名 字 ， 当 前 局 部 变量 以 及 可 以 访问 的 模块 名 。 对 于 点 分 表达 式 如 string.a， 它 将 求 出 表达 式 
最 后 一 个 '. 之 前 的 值 ， 然 后 根据 结果 的 属性 给 出 补 全 的 建议 。 注 意 ， 如 果 一 个 具有 getattr() 方 
法 的 对 象 是 表达 式 的 某 部 分 ， 这 可 能 执行 应 用 程序 定义 的 代码 。 上 默认 的 配置 同时 会 把 历史 记 

录 保 存在 你 的 用 户 目录 下 一 个 名 为 .python_history 的 文件 中 。 在 下 次 与 交互 式 解释 器 的 回话 

中 ， 历 史记 录 将 还 可 以 访问 。 


4. 浮 点 数 运算 : 问题 和 局 限 
浮 点 数 在 计算 机 硬件 中 表示 为 以 2 AE 二进制) 的 小 数 。 例 如 ， 十 进 制 小 数 


0.125 


1/10 + 2/100 + 5/1000 的 值 ， 同 样 二 进 制 小 数 


0.001 


是 0/2 + 0/4 + 1/8 的 值 。 这 两 个 小 数 具 有 相同 的 值 ， 唯 一 真正 的 区 别 是 ， 第 一 个 小 数 是 十 进 
制 表 示 法 ， 第 二 个 是 二 进 制 表 示 法 。 


不 幸 的 是 ， 大 多 数 十 进 制 小 数 不 能 完全 用 二 进 制 小 数 表 示 。 结 果 是 ， 一 般 情况 下 ， 你 输入 的 
十 进 制 浮 点 数 仅 由 实际 存储 在 计算 机 中 的 近似 的 二 进 制 浮 点 数 表示 。 


这 个 问题 在 十 进 制 情况 下 很 容易 理解 。 考 虑 分 数 113， 你 可 以 用 十 进 制 小 数 近 似 它 : 


0.3 
或 者 更 接近 的 
0.33 


或 者 再 接近 一 点 的 


0.333 


等 等 。 无 论 你 愿意 写 多 少 位 数字 ， 结 果 永 远 不 会 是 精确 的 1/3， 但 将 会 越 来 越 好 地 逼近 1/3, 


同样 地 ， 无 论 你 使 用 多 少 位 的 二 进 制 数 ， 都 无 法 确切 地 表示 十 进 制 值 0.1。1/10 用 二 进 制 表示 
是 一 个 无 限 循环 的 小 数 。 


0.0001100110011001100110011001100110011001100110011... 


在 任何 有 限 数量 的 位 停 下 来 ， 你 得 到 的 都 是 近似 值 。 今 天 在 大 多 数 机 器 上 ， 浮 点 数 的 近似 使 
用 的 小 数 以 最 高 的 53 位 为 分 子 ，2 的 千 为 分 母 。 至 于 1/10 这 种 情况 ， 其 二 进 制 小 数 是 
3602879701896397/2**55， 它 非常 接近 但 不 完全 等 于 1/10 真 实 的 值 。 


由 于 显示 方式 的 原因 ， 许 多 使 用 者 意识 不 到 是 近似 值 。Python 只 打印 机 器 中 存储 的 二 进 制 值 
的 十 进 制 近似 值 。 在 大 多 数 机 器 上 ， 如 果 Python 要 打印 0.1 存储 的 二 进 制 的 真正 近似 值 ， 将 
会 显示 

>>> 0.1 


0.1000000000000000055511151231257827021181583404541015625 


这 么 多 位 的 数字 对 大 多 数 人 是 没有 用 的 ， 所 以 Python 显示 一 个 舍 入 的 值 


>>> 1 / 10 
0.1 


只 要 记 住 即使 打印 的 结果 看 上 去 是 精确 的 1110， 真 正 存 储 的 值 是 最 近似 的 二 进 制 小 数 。 


例如 ， 数 字 0.1、0.10000000000000001 和 
0.1000000000000000055511151231257827021181583404541015625 都 以 
3602879701896397/2**55 为 近似 值 。 因 为 所 有 这 些 十 进 制 数 共 享 相同 的 近似 值 ， 在 保持 恒 等 
式 eval(repr(x))==x 的 同时 ， 显 示 的 可 能 是 它们 中 的 任何 一 个 。 


现在 从 Python 3.1 开始 ，Python (在 大 多 数 系统 上 ) 能 够 从 这 些 数字 当中 选择 最 短 的 一 个 并 
简单 地 显示 0.1。 


注意 ， 这 是 二 进 制 浮 点 数 的 自然 性 质 : 它 不 是 Python 中 的 一 个 bug ， 也 不 是 你 的 代码 中 的 
bug。 你 会 看 到 所 有 支持 硬件 浮 点 数 算法 的 语言 都 会 有 这 个 现象 〈 尽 管 有 些 语言 默认 情况 下 或 
者 在 所 有 输出 模式 下 可 能 不 会 显示 出 差异 ) 。 


为 了 输出 更 好 看 ， 你 可 能 想 用 字符 串 格 式 化 来 生成 固定 位 数 的 有 效 数字 : 


>>> format(math.pi, '.12g') # give 12 significant digits 
'3.14159265359' 


>>> format(math.pi, '.2f') # give 2 digits after the point 
'3.14' 


>>> repr(math.pi) 
'8.141592653589793' 
认识 到 这 ， 在 真正 意义 上 ， 是 一 种 错觉 是 很 重要 的 : 你 在 简单 地 舍 入 真实 机 器 值 的 显示 。 


例如 ， 既 然 0.1 不 是 精确 的 1110，3 个 0.1 的 值 相 加 可 能 也 不 会 得 到 精确 的 0.3 : 


Seea al a al a A SS S) 


False 


AM, BLA. 178 S GR 1/1 OF 88 m ELO.378 86 He 3/10R sat a, Around iE 
前 舍 人 也 没有 帮助 : 


>>> round(.1, 1) + round(.1, 1) + round(.1, 1) == round(.3, 1) 
False 


BAX SAR) RES BH 2B], round) KAANAA FEHR LAATS 
和 入， 这样 的 话 不 精确 的 结果 就 可 以 和 另外 一 个 相 比较 了 : 

>>> round(.1 + .1 + .1, 10) == round(.3, 10) 

True 


样 意 想 不 到 的 结果 。"0.1” 的 问题 在 下 面 "误差 的 表示 "一 节 中 有 准确 


二 进 制 浮 点 数 计算 有 很 多 这 样 意 
常见 怪异 现象 请 参见 浮 点 数 的 危险 。 


详细 的 解释 。 更 完整 的 


最 后 我 要 说 ,，“ 没 有 简单 的 答案 "。 也 不 要 过 分 小 心 浮 点 数 ! Python 浮 点 数 计算 中 的 误差 源 之 
于 浮 点 数 硬件 ， se re 2**53 分 之 一 。 对 于 大 多 数 任务 这 已 经 足 
够 了 ， 但 是 你 要 在 心中 记 住 这 不 是 十 进 制 算法 ， 每 个 浮 点 数 计算 可 能 会 带 来 一 个 新 的 舍 入 错 
误 。 

虽然 确实 有 问题 存在 ， 对 于 大 多 数 平常 的 浮 点 数 运 算 ， 你 只 要 简单 地 将 最 终 显示 的 结果 舍 入 
到 你 期 望 的 十 进 制 位 数 ， 你 就 会 得 到 你 期 望 的 最 终结 果 。str() 通 常 已 经 足够 用 了 ， 对 于 更 好 的 
控制 可 以 参阅 格式 化 字符 串 语 法 中 strformat() 方 法 的 格式 说 明 符 。 


对 于 需要 精确 十 进 制 表 示 的 情况 ， 可 以 尝试 使 用 decimal 模 块 ， 它 实现 的 十 进 制 运算 适合 会 计 
方面 的 应 用 和 高 精度 要 求 的 应 用 。 


fractions 模 块 支持 另外 一 种 形式 的 运算 ， 它 实现 的 运算 基于 有 理 数 (因此 像 1/3 这 样 的 数字 可 
以 精确 地 表示 ) 。 


Me i 作 的 重度 使 用 者 ， 你 应 该 看 一 下 由 SciPy 项 目 提 供 的 Numerical Python 包 和 
它 用 于 数学 和 统计 学 的 包 。 参 看 [http://scipy.org](http://scipy.org)。 


当 你 真 的 真 想 要 知道 浮 点 数 精确 值 的 时 候 ，Python 提供 这 样 的 工具 可 以 帮助 
你 。float.as_integer_ratio() 方 法 以 分 数 的 形式 表示 一 个 浮 点 数 的 值 : 


>>> x = 3.14159 
>>> x.as integer ratio() 
(3537115888337719, 1125899906842624) 


为 比值 是 精确 的 ， 它 可 以 用 来 无 损 地 重新 生成 初始 值 


>>> x == 3537115888337719 / 1125899906842624 
True 


float.hex() 方 法 以 十 六 进 制 表示 浮 点 数 ， 给 出 的 同样 是 计算 机 存储 的 精确 值 : 


>>> x.hex() 
'0x1.921f9f01b866ep+1' 


精确 的 十 六 进 制 表示 可 以 用 来 准确 地 重新 构建 浮 点 数 : 


>>> x == float.fromhex('0x1.921f9f01b866ep-*1') 
True 


因为 可 以 精确 表示 ， 所 以 可 以 用 在 不 同 版 本 的 Python (与 平台 相关 ) 之 间 可 靠 地 移植 数据 以 
及 与 支持 同样 格式 的 其 它 语言 (例如 Java 和 C99) 交换 数据 。 


另外 一 个 有 用 的 工具 是 math.fsum() 画 数 ， 它 帮助 求 和 过 程 中 减少 精度 的 损失 。 当 数值 在 不 停 
地 相 加 的 时 候 ， 它 会 跟踪 “丢弃 的 数字 ”这 可 以 给 总 体 的 准确 度 带 来 不 同 ， 以 至 于 错误 不 会 囚 


积 到 影响 最 终结 果 的 点 : 


>>> sum([0.1] * 10) == 1.0 

False 

>>> math.fsum([0.1] * 10) == 1.0 
True 


14.1. —# HARV RE 


这 一 节 将 详细 解释 "0.1” 那 个 示例 ， 并 向 你 演示 对 于 类 似 的 情况 自己 如 何 做 一 个 精确 的 分 析 。 
假设 你 已 经 基本 了 解 浮 点 数 的 二 进 制 表示 。 


二 进 制 表 示 的 误差 指 的 是 这 一 事实 ， 一 些 (实际 上 是 大 多 数 ) 十 进 制 小 数 不 能 精确 地 用 二 进 制 
小 数 表示 。 这 是 为 什么 Python (HA Perl C. C++, Java, Fortran 和 其 他 许多 语言 ) iB 
常 不 会 显示 你 期 望 的 精确 的 十 进 制 数 的 主要 原因 。 


这 是 为 什么 ? 1/10 和 2/10 不 能 用 二 进 制 小 数 精确 表示 。 今 天 (2010 年 7 A) 几乎 所 有 的 机 
器 都 使 用 IEEE-754 浮 点 数 算 法 ， 几 乎 所 有 的 平台 都 将 Python 的 浮 点 数 映射 成 IEEE-754"“ 双 
精度 浮 点 数 "。754 双 精 度 浮 点 数 包含 53 位 的 精度 ， 所 以 输入 时 计算 机 努力 将 0.1 转换 为 最 接 
近 的 JI2*N 形式 的 小 数 ， 其 中 J 是 一 个 53 位 的 整数 。 改 写 


1 / 10 ~= J / (2**N) 


J ~= 2**N / 10 


回想 一 下 JJ 有 53 位 (>=252(8<253) ， 所 以 N 的 最 佳 值 是 56 : 


>>> 2**52 <= 2**56 // 10 < 2**53 
True 


BN 56 是 入 保证 J 具有 53 位 精度 的 唯一 可 能 的 值 。J 可 能 的 最 佳 值 是 商 的 舍 入 : 


>>> q, r = divmod(2**56, 10) 
>>> r 
6 


由 于 余数 大 于 10 的 一 半 ， 最 佳 的 近似 值 是 向 上 舍 入 : 


>>> q+1 
7205759403792794 


因此 在 754 双 精 度 下 1/10 的 最 佳 近似 是 : 


7205759403792794 / 2 ** 56 


分 子 和 分 母 都 除 以 2 将 小 数 缩小 到 : 


3602879701896397 / 2 ** 55 


请 注意 由 于 我 们 向 上 舍 入 ， 这 其 实 有 点 大 于 1/10 ; 如 果 我 们 没有 向 上 舍 入 ， 商 数 就 会 有 点 小 
于 1/10。 但 在 任何 情况 下 它 都 不 可 能 是 精确 的 1/10! 


所 以 计算 机 从 来 没有 "看 到 "1/10 : 它 看 到 的 是 上 面 给 出 的 精确 的 小 数 ，754 双 精 度 下 可 以 获得 
的 最 佳 的 近似 了 : 


>>>0 ean OO 
3602879701896397 .0 


如 果 我 们 把 这 小 数 乘 以 10**55， 我 们 可 以 看 到 其 55 位 十 进 制 数 的 值 : 


>>> 3602879701896397 * 10 ** 55 // 2 ** 55 
1000000000000000055511151231257827021181583404541015625 


也 就 是 说 存储 在 计算 机 中 的 精确 数字 等 于 十 进 制 什 
0.1000000000000000055511151231257827021181583404541015625。 许 多 语言 (包括 旧 
版 本 的 Python) 会 把 结果 舍 入 到 17 位 有 效 数字 ， 而 不 是 显示 全 部 的 十 进 制 值 : 


>>> format(0.1, '.17f') 
'0.10000000000000001 ' 


fractions 和 decimal 模块 使 得 这 些 计算 很 简单 : 


>>> from decimal import Decimal 
>>> from fractions import Fraction 


>>> Fraction. from_float(0.1) 
Fraction(3602879701896397, 36028797018963968) 


>>> (0.1).as integer ratio() 
(3602879701896397, 36028797018963968) 


>>> Decimal.from float(0.1) 
Decimal('0.1000000000000000055511151231257827021181583404541015625') 


>>> format(Decimal.from float(0.1), '.17') 
'0.10000000000000001 ' 


